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“关于 如 何 设计 .实现 和 有 效 使 用 库 函 数 的 指南 少 之 又 少 (如 果 说 还 有 的 话 )， 这 本 力作 填补 了 这 
个 空白 。 它 可 以 作为 下 一 代 软 件 的 工具 书 ， 所 有 的 C 语 言 程序 员 都 应 该 阅读 。“ 
一 一 W. Richard Stevens 
“我 向 每 位 专业 C 语 言 程序 员 推荐 这 本 书 。C 语 言 程序 员 们 忽视 书 中 所 描述 的 各 种 技术 已经 太 长 时 
间 了 。 Norman Ramsey， 贝 尔 实验 室 研究 员 








每 一 位 程序 员 和 软件 项 目 经 理 必 须 掌握 创建 可 重用 软件 模块 的 技术 : 可 重用 软件 模块 是 
构建 大 规模 . 可 靠 应 用 的 基石 。 与 当前 某 些 面向 对 象 语言 不 同 ，C 语 言 为 创建 可 重用 应 用 程 
序 接口 (Application Programming Interface, API) 提供 的 语言 和 功能 支持 非常 少 。 尽 管 大 多 
数 C 语 言 程序 员 在 自己 所 编写 的 每 一 个 应 用 程序 中 都 使 用 API 和 实现 API 的 库 ， 但 只 有 相当 少 
的 程序 员 可 以 创建 和 发 布 新 的 、 可 广泛 使 用 的 AP1。 本 书 阐 述 了 如 何 用 一 种 与 语言 无 关 的 方 
法 将 接口 的 设计 与 实现 独立 开 来 ， 从 而 形成 一 种 基于 接口 的 设计 途径 来 创建 可 重用 的 APl。 
书 中 提供 大 量 实例 具体 说 明 这 种 方法 。 作 者 详细 描述 了 24 个 接口 和 它们 的 实现 细节 ， 有 助 于 
读者 对 这 种 设计 方法 的 透彻 理解 。 


本 书 具 有 如 下 特色 


简洁 明了 的 接口 描述 ， 为 对 接口 设计 感 兴趣 的 程序 员 提 供 了 一 个 参考 手册 

每 一 章 接口 的 代码 实现 分 析 将 帮助 读者 修改 . 扩充 一 个 接口 ， 或 者 设计 相关 接口 

深入 探讨 了 “算法 工程 ”: 阐述 如 何 将 数据 结构 以 及 相关 算法 打包 到 可 重用 模块 中 

24 个 API 和 8 个 实例 程序 的 源 代码 都 经 过 测试 检查 ， 每 个 程序 都 是 按照 “literate 程 序 ” 的 形 
式 构成 ， 为 源 代码 提供 了 全 面 完整 的 解释 

© 提供 了 非常 少见 的 有 关 C 语 言 编程 技巧 的 文档 记录 

e 可 以 方便 地 在 http://www.cs.princeton.edu/software/cil/ 访问 本 书 的 所 有 源码 
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出 版 者 的 话 


SOE SCAMS. MAER URL PON m EH TRE ABU. 使 琴 方 同 家 车 自然 科学 的 
各 个 领域 取得 E 是 这 detii. WE ELER RIERA | £t RIA 
KEM, RARE AANER N. CARRA f 8 ed RA fr, HHL 
学 科 中 Je LU SEE Id bj b F| IN 5 iii itin AE) g REE E. ABE 
RJ OR AUER. IRIA ( 24 SLIM AME, LATE ARE, SMA RS 
因 年 月 的 流逝 向 减 进 、 

近年 CEPR EMEA AR. Sep AYE) PL ed IR i. XI ee A ABR H 
HRH RAHE HLZ FT FALH i A AB SE BL d 而 六 于 教材 的 建设 在 教育 战略 
IR RE eS RMR K E 、 从 下 大 员 较 分 的 现状 下 、， 英 国 等 发 达 国 家 
在 其 计算 机 科学 发 展 的 世上 年 辽 1h i SRE - I. slt it si 
SME Att BALRA ROSE li| LOY sede AY Ea B: RI. Ua Sti Peet 
WORE ROTA iiA i 2 

SLE T. dE ts guns ui mpm 为 教育 服务 ”11998 午 开始， 
AES uf NE. PETRI ML ICM [FEILER SO, FRA 
Prentice Hall. Addison-Wesley. McGraw-Hill. Morgan Kaufmann "FIA 攻 名 出 版 公司 建立 了 
BSA AME SAR, COITU AY Be BE Ad pE ve | Tanenbaum , Stroustrup, Kernighan , 
Jim Gray FAMA RA A a, CTE UPR” WARR, (RE Sek oy BF 
PER BER. AME CMS Hj. dn z AA {SES s fc ARGY 

“计算 袖 科 学 从 所 ”的 出 版 上 用 RN INARA AE. PRU S AS UE (ih 
He AEH. MERRET LATE Pale f 3 的 作者 也 相当 关注 其 作品 在 
PEMER. AINE EIR AIBARA H A, MAR USS ER STE 
品种 ， 这 些 书 籍 存 读者 中 CRAIE. MITE BER AEREA MSKR. A 
UE AE 与 发 展 扣 下 了 人 基础 

随 关 学 科 建 设 的 初 此 完善 和 教材 改 吕 的 这 渐 深化 .教育 界 对 国外 计算 机 教材 的 需求 和 应 
用 都 步 入 一 个 新 的 阶段 ， 为 此 ， 华 迪 公 司 将 如 天 员 进 教材 的 广度 .在 “华章 教育 ”的 总 再 划 
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ATE "Schaum's Outlines” AY HUR 
BIA rE Af 为 学 校 和 老师 
上 国防 科技 太 学 、 复 所 大 学 、| 
RY WEE TR 通 人 学 +q 
` PIRR, (2) WAKE, W 
北 于 学 院 PRR ej AWE 25$ OT TR KS AB ATE BLA EH MLA 1 nn 
的 著名 学 者 组 城 “ 专家 指导 委员 会 "， 为 我 们 提供 选 题 启 见 和 和 出 版 监督 

这 -会 从 书 吓 响应 吉 育 部 提出 的 使 用 外 版 教材 的 号 召 ， 为 国内 高 校 的 计算 机 及 相关 专业 
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(eee Be EAR MIS Rory E SUBE] UM. L T.. Stanford, U.C. Berkeley, C. M. U. 等 世界 
名 牌 大 学 所 采用 。 AS ot a ( FET. USA. BRR SE. AIURRI. RHEE 
Hie BM, BOP. BEF. BRS, RRS SR AKER HU E LRA RHR 
心 课程 ， 而 且 各 其 特色 一 一 有 的 出 自 诸 言 设计 者 之 手 、 有 的 历经 二 二 年 而 不 衰 、 有 的 已 被 全 
世界 的 几 百 所 高 校 采 用 ~ 企 这 些 圆 熟 通 博 的 名 师 估 作 的 指引 之 下 ， 读 才 必 将 在 计算 机 科学 的 
宫 暴 中 出 登 堂 而 入 室 。 

权威 的 作者 、 经 典 的 教材 、 一 流 的 谋 者 、 严 格 的 审 校 、 精 细 的 编辑 ， 这 些 因素 使 我 们 的 
BASAT RAR AUER TE, IC ATHY Hin BS RUSSE, mU UL EE RIS BUX PEK B 36 
KESH k. HOM RUM RII ER TIS EUR SAYA. Ey A) RI iet A 
作 提出 建议 或 给 PHEW IAM: 


电子 邮件 : hzedu@bzbook.com 

联系 电话 : (010 ) 68995264 

联系 地 址 ， 北 京 市 西城 区 百 万 庄 南 街 1 S 
ARR: 100037 
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( 按 姓氏 笔画 顺序 ) 


KFA Eos Bee £ 史 美 林 
石 教 英 a ox TEX KES RR 
Ki 345 3 李 师 贤 李 建 中 杨 冬青 
邵 维 起 陆 丽 娜 fh Bik 陈 向 群 周 伯 生 
周 克 定 es EDI emp iE A 
郑 国 梁 施 伯乐 钟 玉 琢 aem REL 
高 传 善 梅 È 程 起 程 时 端 谢 希 仁 


译 者 & 


可 下 用 软件 模块 是 构建 太 规 异 、 可 靠 心 用 的 此 石 . f hf riy 种 软件 项 上 日 经 埋 必 须 掌 
所 创建 可 重用 软件 模块 的 技术 。literate 程 序 设 计 呈 一 种 将 编程 代码 实现 与 文档 描述 语言 结合 
起 来 的 编程 方法 ， literae PY OA PET ICES HCE. EORTC RMR Hs ACR YEE At 
TAMA AB VERE. 7845 ED AL BR OD Ard E877 a. A 述 如 何 用 RE PF HK 
的 方法 将 接口 的 设计 与 实现 独立 开 来 ， 从 而 设计， 实现 和 有 效 使 川 C 启 言 库 丙 数 、 掌 所 创建 可 
重用 C 诸 言 软件 模 寺 技术 

ARETE FOCA BOEZA HEM. 诬 入 详细 地 描 运 了 24 个 C 请 言 接口 太 上 实 
现 ,内 容 包括 : Sea AUB URGERE. dede. du. EA. ABE PRON PR, fer a, 
BECK. HE RAER, BATAR. ME. ESSER EU RAR G, 
是 一 本 为 C 语 言 编 各 人员 排 优 和 解难 的 参考 书 
i 对 十 创建 可 重用 API 只 提供 也 > 的 语言 ATE CHE ”尽管 大 多 数 C 语 方程 序 员 
在 自己 所 继 写 的 每 一 个 应 用 程序 中 部 使用 API 和 实现 API 的 库 。 仁 只 有 相当 少 的 程序 员 可 以 创 
BURTA. G) MRAPI. 

本 书 基 有 简 清明 了 的 接口 描述 、 为 对 搂 册 设计 感 兴趣 的 程序 员 提 供 了 一 个 参考 了 肌 ， 每 一 
章 接 绰 的 代码 实现 分 析 将 帮助 访 状 艇 改 、 扩 充 一 个 接口 ， 或 并 设计 相关 接 11 入 探讨 了 将 
数据 结构 以 及 机 关 算 法 打包 到 可 焉 用 模块 中 的 我 术 和 实现 我 瑟 ，24 个 AP1 和 8 个 实例 程序 的 小 
代码 部 经 过 测试 检查 ， 街 个 程序 都 足 掖 照 “literate ft E" RELI. WWE r RRE 
整 的 解释 。 本 bidet FIBA A IU HHR A LAJIT KC A WA RP, hE eR 
加 以 方便 地 在 Fitp: / /www. cs .princeton.eóu:softwaze/c!i, Wh BINT Re. 

A KRR ALEE TAR HEA. BAREH CHE) BAILES 4: BRAT 
法 入 于 ,在 此 基础 上 结合 作 AE Bee A us tt AIG S mar pom 
FETT RATE BLUE, Rf ege RBG. Gn C | SERIA 
研究 经 验 。 他 曾经 同 贝尔 实验 室 合作 开展 的 用 CC 语言 的 高 质量 
编译 中 cc 的 合作 开发 者 。 书 中 的 讲述 思路 消 晰 ， ， 首 卫 还 其 布 主语 的 示例 ， 安 
FAA BSB, BEER ARAL. (EA 

SE AE. ALU KER, AR 
FER, MM, FRIR, RMR. AxN, 
Ti S LE KEETA ER GR R BA 
FAR, MENETET GM ee, TIL. 
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用 程序 接 01 (Application Programming Interface, API ) 
的 伟 息 ,大 多 数 人 都 会 使 用 API 和 程 床 语 ， 并 在 其 听 罕 的 圣 -个 应 用 种 序 由 实现 它们 ， 亿 是 很 
少 有 大 会 创建 或 发 布 新 的 能 广泛 应 用 的 API- -、 穆 序 员 似乎 倾向 于 循环 使 用 他 们 自己 的 
东西 ， 而 不 愿意 查找 能 满足 他 们 查 求 的 程序 库 ， 这 或 许 足 因为 写 特定 谈 用 程序 的 代码 要 比 得 
找 设 计 好 的 API 容 易 o 

我 和 下 -- - 代 程序 员 - 样 感到 心虚 : dcc (Chris Fraser 和 我 给 ANSLISO CRT AY BURRS) 是 
建立 在 - : 定 的 背景 之 上 的 《在 《A Retargetable C Compiler: Design and Implementation) —35 
PH XT lee (tü iB, Addison-Wesley, 1995 )， 缩 谋 吕 谍 于 了 这 样 一 种 应 用 程序 ， 该 应 用 程序 
可 以 使 用 怀 准 接 11 ， 并 日 能 够 创建 在 暴 他 地 方 也 可 以 使 用 的 接 叫 
内 存 管 理 、 宁 符 叫 和 符 吕 表 以 及 链表 操作 等 等 ”但 是 lec 仅 使 用 了 很 少 的 标准 C 库 基数 的 例 程 ， 
并 日 几乎 没有 代位 能 够 直接 应 用 到 上 他 应 用 程序 中 o 

本 书 提 但 的 是 一 种 基于 接口 及 其 实现 的 设计 方法 ， 并 且 通 过 对 24 个 候 口 及 其 实现 的 撕 述 
详细 地 演示 了 这 种 方法 。 这 些 接口 涉及 到 计算 机 领 不 的 很 多 知识 ， 此 咎 包括 数据 结构 | 算法 、 
字符 站 处 理 和 并 发 程序 。 这些 实 现 并 不 是 简 单 为 玩具 一 一 它们 足 为 在 产品 代 但 中 使 用 而 设计 
的 。 

CC 编程 语 疝 对 基于 接口 设计 方法 的 文 持 是 极 少 的 ,而 协调 对 象 的 语 育 , C++ 和 Modula-3 , 
则 鼓励 将 接口 实现 分 离 。 基 于 接 [ 的 设计 独立 二 仁 何 竺 
- FEROIB PUA SE 002554 GE JJ AUT df 
的 接 门 ， 反 之 亦 然 。 

RT, = 旦 掌握 了 基于 接 门 的 设计 方法 MAE EE 上 众多 应 用 程序 的 通用 接口 基础 
上 建立 应 用 程序 ,从 市 加速 开 发 -在 一 些 Ct+ 环 境 中 的 基础 类 库 就 体现 了 这 种 效果 。 增 加 对 
现 有 软件 的 重 片 一 一 接口 实现 库 ， 能 够 减少 初始 开发 成 不 ， 回 时 还 能 减少 维护 成 本 ， 因 为 虚 
由 程序 的 路 多 部 分 都 建立 在 经 过 良好 测试 的 通用 接口 的 实现 之 .| 

木 书 提供 的 24 个 接口 来 有 多 种 来 源 、 并 日 针对 不 书 特别 艇 了 修 超 。 . 些 数据 结构 中 的 接 
口 一 和希 象 数据 类 型 ， 源 十 lee 代 贷 和 70 年 代 森 80 年 代 初 所 做 的 Icon 编程 语 实现 代码 CA 
SUR.E.Griswold and M.T,Griswold, The Icon Programming Language, Prentice Hall. 1990), Jt 
TERRORGA ETARE, RIKST e SB ERAT” REA AS ES 
信息 。 

书 由 提供 的 — BOE LAL MEAM UR SAPS. UA TEA e ABS 8009 BEE. ink. À 1 
MEAE ERE HR A REE HER 一 iis HIS ESTE EUR ER. RT 
AERO EE LI DETI QUE (oe THe 00 SON SR BUTT LAY REA. DI. Ts 4gRobert Sedgewick (ij 
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(Algorithms in C ) (Addison-Wesley, 1990 ) 这 样 的 传统 数据 结构 利 健 活 教 材 是 相得益彰 的 。 

大 多 数 章节 会 质 述 :个 接口 及 其 实现 ; 有 少数 音节 还 会 描述 与 上 相关 的 接口 ， 每 一 章 的 
“接口 ”部 分 将 会 单独 给 出 一 个 明确 且 详 细 的 接口 措 述 。 对 丁 兴 趣 仪 在 丁 接站 的 程序 员 来 说 ， 
这 些 节 就 相当 于 “本 参考 手册 。 少 数 章 他 还 会 包含 “示例 ”部 分 ， 该 节 将 会 说 明 在 一 个 简单 
的 应 用 程序 中 个 或 多 个 按司 的 使 用 

每 章 的 “实现 ”部 分 将 会 详细 地 介绍 本 章 接口 的 实现 代码 -在 一 些 例子 中 ， 对 一 个 接口 
将 会 给 出 多 种 实现 方法 ， 以 展示 基于 接口 设计 的 优点 .这 些 节 对 于 修改 或 扩展 一 个 接口 或 是 
设计 一 个 相关 的 接口 将 大 有 神 益 。 许 多 练习 题 将 会 些 设计 与 实现 的 其 他 可 行 方法 。 如 
果 仪 是 为 了 理解 如 何 使 用 接 11， 可 以 不 用 阅读 “实现 ”一 节 - 

接口 、 椒 例 和 实现 都 以 literate 程 序 的 方式 给 出 ， 换 名 话说， 流 代 码 太 其 解释 是 按照 
合理 解 代码 的 顺序 交织 出 现 的 。 代 码 可 以 白 劲 地 从 不 书 的 文本 文件 让 抽取 ， 并 按 C 编 程 语序 所 
规定 的 顺序 组 合 起 来 。 其 他 包含 C 语 言 literate 程 序 设 计 例 子 的 书籍 有 《A Retargetable C 
Compiler 》 和 D.E,Knuth 扎 的 《The Stanford GraphBase: A Platform for Combinatorial 
Computing 》( Addison-Wesley, 1993 )。 
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森 书 材料 可 分 成 下 面 的 几 大 类 ; 
基础 1. 简介 

2. 接口 与 实现 

4. 异常 与 断言 

5 .内存 管 理 
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10. 动态 数组 

11.88] 

12.5 

13. 位 向 其 
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15. RACE feb 
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算法 17.3 

18. (L aS 
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通读 第 1 到 4 章 的 内 容 将 使 大 多 数 读 者 有 所 鲁 益 ， 具 为 这 几 章 形成 了 本 书 其 余部 分 的 框架 。 
翻 下 的 章 可 以 按 任 何 顺序 阅读 ， 信 管 后 面 的 某 些 章 会 参考 其 前 面 的 内 容 - 

第 1 章 涵 盖 了 literate 程 序 设计 和 编程 风格 与 效率 的 讨论 ; 第 2 草 提出 并 描述 了 基于 接 门 的 
设计 方法 ， 定 义 了 相关 的 术语 ,并 演示 了 两 个 简单 的 接口 及 其 实现 ; 第 3 章 描述 了 原子 接口 的 
实现 原型 ， 这 是 本 节 中 最 简单 的 具有 产品 质量 的 接 11; 第 4 章 介 绍 了 在 每 ”个 接口 中 都 会 用 到 
的 异常 与 断言 ; 第 5 、6 章 描述 了 几乎 所 有 的 实现 部 会 用 到 的 内 存 管理 : EB) fI — E EROR 
了 一 个 接口 及 其 实现 - 


使 用 建议 


我 们 假设 本 飞 的 读者 已 经 了 解 子 在 大 学 介绍 性 的 编程 课 积 中 涉及 到 的 关于 C 语 疼 的 内 容 ， 
并 且 都 实际 使 用 过 类 似 于 C 算 法 的 以 文本 形式 绽 出 的 基本 数据 结构 。 在 党 林 斯 顿 ， 这 本 书 的 内 
容 被 用 做 大 学 二 年 级 学 生 到 研究 生 一 年 级 的 系统 编程 课程 的 教材 。 许多 接口 使 用 的 都 是 高 级 C 
语言 编程 技巧 ， 比 如 说 不 透明 的 指针 和 指向 指针 的 指针 等 等 ， 因 此 这 些 接口 都 是 非常 好 的 技 
术 实 例 ， 且 其 中 的 技术 在 系统 编程 和 数据 结构 课程 中 非常 实用 。 

这 本 书 可 以 以 多 种 方式 在 课堂 上 使 用 ,最 简单 的 就 是 用 在 面向 项 日 的 谍 程 中 。 例 如 ， 在 
编译 原理 课程 中 ， 学 竺 通常 需要 为 “个 玩具 语言 编写 -个 编译 器 ， 在 图 形 学 课程 中 向 样 出 经 
常 有 一 些 实际 的 项 目 。 许 多 接口 消 除了 具体 项 日 所 需要 的 一 些 令 人 上 庆 烦 的 编程 ， 这 样 就 使 得 
这 类 课程 中 的 项 目 得 到 简化 。 这 种 用 法 可 以 帮助 学 后 认识 到 在 项 日 中 重用 代码 可 以 节省 大 量 
劳动 ， 并 且 引 时 学 生 在 其 项 目 中 对 自己 所 做 的 部 分 尝试 使 用 基于 接 11 的 设计 。 后 首 在 团队 项 
APRA, AA “REHA” HAT Oe BT BL 

ALAS ERR a EE ASL, AG Se We Rw ERN 
RURAR, KAAMEA. Bn obe Mdb, RERI PH fen Table HELI, 它 的 
实现 的 目标 代码 以 及 第 8.2 节 中 搭 述 的 单词 狐 率 程序 wf 的 说 明 ， 让 学 生 只 使 用 我 们 为 Table 设 计 
的 目标 代码 来 实现 wf- 在 下 一 个 作业 中 、 他 们 得 到 了 wf 的 日 标 代码 但 必须 实现 Table。 有 时 ， 
我 颠倒 这 些 作业 ， 但 是 这 两 种 顺序 对 天 部 分 学 沾 来 说 部 是 很 不 -- 伴 的 、 他 们 不 匀 惯 在 他 们 的 
大 部 分 程序 中 只 使 用 目标 代码 ， 并 且 这 些 作业 通常 都 总 他 们 争 一 次 接触 接口 和 程序 说 明 中 使 
用 的 半 正 式 表 示 法 。 

最 初 布 早 的 作业 也 介绍 了 作为 接口 说 明 必 婴 细 成 部 分 的 可 检查 的 运行 时 错误 和 断言 
(assertion )。 经 过 几 个 这 样 的 作业 之 后 ,学 生 们 才 开 始 理 解 这 些 概 念 的 Xo RIE SRR TE 
(unannounced ) Jit, Hib JEU AY HR 128 BOK ORR AIR AY, 164 r RAR 30 RE PER BU 
WES. RPR PRTA, 但 是 它 能 够 引起 学 生 们 的 注意 ; T H t AER PR 全 语言 的 
好 处 ， 例 如 ML 和 Moduta-3 ， 在 文 些 语 青 由， 不 会 出 现 突 证 【这 种 分 级 策略 没有 它 听 上 
去 那么 苗 刻 ， 因 为 在 分 成 多 个 部 分 的 作业 由， 只 有 产生 溃 突 的 于 部 分 作业 才 A HA m 
量 不 同 的 作业 将 得 到 不 同 的 分 数 。 我 给 过 许多 0 分 ， 但 是 从 来 没有 内 此 导致 任何 一 个 学 生 的 课 
程 成 绩 很 低 )， 

一 号 学生 们 有 了 属于 他 们 白 己 的 少数 儿 个 接口 后 . 接 下 米 就 让 他 们 设计 新 的 接口 并 洪 用 
他 们 以 前 的 设计 选择。 例如 ，Andrew Appel REE KAI- ' 个 作业 是 - -个 原始 的 测试 程序 。 学 生 
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们 以 组 为 草 位 设计 -个 作业 需要 的 任意 算术 精度 的 接口 ， 作 业 的 结果 类 似 于 第 17 到 19 章 中 描 
述 的 接口 。 不 同 的 组 设计 藤 接 口 不 同 ， 完 成 后 对 这 些 廉 口 进行 比较 ， 一 :个 组 对 另 一 个 组 设计 
的 接口 进行 评价 ， 这 样 做 很 有 所 迪 作用 ，Kai Li 的 需要 一 个 学 期 米 完成 的 项 目 也 达到 了 同样 的 
学 习 实战 效果 ， 该 玖 日 使 用 TeiTk 系 统 (J.K. Ousterhout, (Tcl and the TkToolkit 》 Addison- 
Wesley 1994 ) 以 及 学 生 们 没 计 和 实现 的 编 糙 程序 二 者 的 接口 ， 构 建 了 -个 其 本 X 的 编辑 程序 - 
Tk 本 身 就 提供 了 男 一 个 很 好 的 基 十 按 [1 设 计 的 例子 - 

在 高 级 染 程 让， 我 通常 把 作业 打包 成 接 11， 计 学 生出 上 出 地 修改 和 和 改进 ,甚至 改变 作业 的 
HA. 给 他 们 -个 出 2 以 减少 下 成 作业 折 需 的 时 间 ， 并 元 许 他 们 做 一 此 实 质 性 的 修改 ， 
E SERI 了 有 创造 性 去 的 解决 办 法 。 s DEEE 不 成 功 的 方法 比 成 功 的 方法 下 
有 教育 总 义 。 学 生 不 可 避 鲍 地 会 走 错 路 、 尖 此 也 付出 了 更 多 的 开发 对 半 ， 但 只 有 当 他 们 过 后 
上 骨 团 过头 来 看 ， 才 会 了 解 所 犯 的 错误 ， 世 才 会 知道 没 Pe RET RR EA. (Hf 
fum 4. HS. WULP AH SEF HAGER. 


如 何 得 到 本 书 的 软件 
本 书 中 的 软件 已 经 在 以 下 的 半 台 上 通过 





















处 FE ae AMY RHE ai od 器 
SPARC SunOS 4.1 lec 3.5 
gee 2.7.2 
Alpha OSF/ 32A lec 4.0 
gec 2.6.3 
cc 
MIPS R3000 TRIX 5.3 lee 3.5 
gcc 2.6.3 
MIPS R3000 Ultrix 4 3 
gee 257 
Pentium Windows 95 Microsoft Visual C/C++ 4.0 


Windows NT 3.51 





其 中 少数 实现 是 针对 特定 向 器 的 : PES HUB BEAL BALA BL adh AL AP BS EB qt 
JEEE 浮 点 算术 ， 并 且 无 符号 的 长 整数 可 以 用 来 保存 对 象 指针 

A8 P BER WARF ftp.cs.princeton.edu f [1 xpub/packages/cii E, HE 名 账号 就 可 以 
得 到 。 使 用 ftp 窜 户 端 软件 连接 到 ftp.cs.princeton.edu， 转 到 pub/packsages/cii [1 $, 下 载 
README 文 件 ， 文 件 中 说 明了 日 录 的 内 容 以 太 如 何 下 载 由 版 物 、 

大 多 数 最 新 的 出 版 物 通常 部 是 以 siixy.tar.gz 此 ciixy.zip 的 文件 各 在 储 的 、 共 中 xy 中 版 本 号 ， 
例如 10 是 指 版 本 1.0、ciixy,targz 昆 用 gzip 正 缩 的 UNIX tar SC, Miciixy.zip Æ jPKZIP 2.04g 版 
兼容 的 7 下 文件 clixy.zip dy zc E SDOS/Windows FJ LAKE. fg -4 EDA EI 车 和 换行 
符 结束 的 。ciixy.zip 同 时 由 可 以 在 美 内 在 线 ，CompuServe 以 及 下 他 在 线 服 务 器 二 得到- 

在 World Wide Web FRUURL Hi ithtrp://www.cs.princeton.edu/software/cii/ 二 同样 也 可 以 得 
到 相应 的 信 该 页 而 还 包括 了 一些 错误 报告 说 明 。 
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PARE IE E h VE IR EY, BE SUR sih RET EHE IR PC, re gn 
RAT. Sp UTA FAB MURAD RUM REIT LE OR TE a HUS RHE EZE 
(me ERT & HA ER Ve M SIC. EE PET et et - EZ HU ABE a H Fry z 
MARE A nT ae to A sha. At PSP ABT VA PL Rag Te uote (Op , 

(LURAY, eI [AOE PES UT IME RL KEP POE BUS, 
B. - 般 只 在 使 用 MO Ri fé iñ EAT SUAE COUPE de N Arce EFE RAI MARNA (SR ALIE 
TUY bYAU 8 as RP e Hi SR CEA A Tt. Hat bL LERE 88% JE ERE 
THAXCIE A JH of malloc 和 free 足 经 常会 出 现 的 。 

出 现 这 种 情况 有 有 几 个 檀 抽 质疑 的 理由 : 其 一 足 健壮 性 强 、 设 计 骨 好 的 通用 模块 库 很 少 、 
其 中 一 些 可 使 用 的 库 几 很 平 嵌 口 缺少 标准 .C 话 二 这 从 1989 年 杠 就 已经 以 症 化 了 、 但 直到 最 
近 才 出 现在 大 部 分 平台 中 

3 -个 理由 就 是 库 的 大 小 : EER AT AE Fig for eq l QU Re OF 
供 要 的 努力 接近 于 编 扎 应 用 程序 所 花费 的 精力 ， 称 员 很 可 能 为 了 方便 而 下 新 实现 他 们 所 
BAG MEUS APERO eur AZ RR TR AY FA) V E GE RY E k Shim. 

FAITE f Br H OQ AER BE | 小 心 钼 印 通 用 人 性、 简单 性 和 有 效 忻 问题 、 
如 果 - -个 程序 库 中 的 例 程 和 数据 站 和 枸 太 通用 了， 头 丰 可 能 导致 使 用 朵 难 或 准 十 达到 它们 想 要 
法 到 的 目的 。 如 染 它 们 太 简 单 上， 就 本 能 不 满足 应 乃 程 齐 的 使 用 需要 。 如 果 它 们 太 易 混淆 
编程 者 出 不 会 使 用 它们 。C 语 言 库 本 身 有 一 此 容易 混 淆 的 例子、 例如 它 的 realloc wi, 

程序 库 的 实现 剖面 临 着 RCL AS UAL ME, BUMS DEE RD A AIC SIL AS WS FH 








过 
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PU, MUR PEAT APR aR RRL EAA 一 成 只 中 感觉 二 是 这 样 一 - -编程 并 也 会 设计 他 们 
[lC BORER PEE. RAR TOL Uk PSB ATP. WB LOG TAE LE AIR 


SH ELAR PERE WE lar JE THE | 

AU -AP REAGAS. BOB EXE IE HCR SES SIRO (ERO H. m + 
程序 库 给 出 了 一 系列 模块 .为 “小 规模 编程 (programming-in-the-small ”提供 晒 数 和 数据 
结构 。 这 些 司 块 适合 用 作 虚 用 程序 中 的 “零件 ”或 只 有 用 千 行 的 应 几 程 序 组 件 . 

在 接 下 来 的 章节 中 所 描述 的 大 部 分 工具 前 在 天 学 的 数据 铺 构 知 算 法 课程 中 涉及 到 了 ， 但 
是 、 在 本 书 中 ,更 多 的 注意 轧 将 被 放 在 它们 是 如 何 拉 包 的 ， 议 及 泉 伴 使 它们 更 健 焉 上 ， 往 不 
积 块 都 给 则 了 “个 接口 及 其 实现 ， 在 第 2 剖 中 讲述 的 设计 方法 将 梳 次 的 说 明 从 它们 的 实现 中 
分 离 出 米 ， 提 高 了 说 明 的 清晰 度 和 精确 度 ， 玫 上 且 有 利 十 提供 健壮 的 实现 。 
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1.1 literate 程序 


木 书 不 是 用 规则 来 描述 模块 MENNT. E Ho E BUR T — PRB HERE 
JBS cé. AAE pE ABE Pliterate e Hi ems BJ. BUR OA AR AR A REE ER 
Xe. SUBIR, RARE AE MRE AN FR AR FU, 1683 B ape A 
本 节 的 文本 、 所 见 即 所 得 。 

literate 程 序 山 英文 和 和 带 标签 的 程序 代码 块 组 成 ”例如 : 








(compute x * yj 
sum - 0; 


for G = 0; i < n; i++) 
sum += x[il*y[ij; 
定义 了 一 个 名 为 <compute x ^ y» Riss 它 的 代码 计算 了 数组 x 和 和 y 的 点 积 。 这 个 块 的 使 用 
是 通过 在 另 -个 代码 块 中 调用 它 来 实现 的 ， 
(function dotproduct)= 


int dotProduct(int x[], int yf}, int n) í 
int i, sum; 


(compute x » y) 
return sum; 
H 
当代 码 块 <fiencrion dotproduct> 从 包含 该 章 的 文本 文件 中 提取 出 米 的 时 候 ， 它 的 代码 被 
原样 复制 ， 块 被 共 代码 代替 ， 依 此 类 排 ， 内 此 提取 <junrction doiproduct» | 53 Eu AAF 
代码 的 文件 


int dotProductCint x[], int y[], int n) í 
int i, sum; 


sum = 0; 
for G = 0; i < n; ie) 
sum += x[i]*y[i]; 
return sum; 
} 
literate £2 TVA HIYE INR BCE aS, HL SCPE ALTE BE. EKUA EIL EER, 
并 且 不 局 限于 程序 语言 的 注释 习惯 
{FSR AL (chunk facility ) 将 literate 程 序 从 出 编 称 设计 语 占 决定 的 次 序 限制 中 解脱 出 
来 。 代 码 五 以 用 最 容易 理解 的 任何 一 种 次 序 显示 ， 而 不 是 用 ! 规 则 指定 的 次 序 最 示 ， 例如 程 
序 实体 必须 在 使 用 它们 之 前 定义 。 
本 书 中 使 用 的 Hterate 编 程 系统 还 有 儿 个 特征 ， 这 些 特征 布 助 士 分 段 描述 程序 。 为 了 说 明 
这 些 特征 并 提供 一 个 literate C 程序 的 完整 合子， 本 节 接 下 来 描述 了 个 名 为 double 的 程序 ， 
FA 00040 AT SB FUIS AA D). (dn “the the."。 例 如 如 下 UNIX 命 令 : 


HOM 





% double intro.txt inter.txt 
intro.txt:10: the 
inter.txt:110: interface 
inter.txt:410: type 
jnter.txt:611: if 


说 明 “the” 在 文件 intro.txt 中 出 现 了 两 次 ,第 二 次 出 现在 第 10 行 ; 例 中 还 显示 了 在 
inter.txt sc P p XE DRUK “interface”, “type” Al "if", 和 如果 double 椒 带 参 数 调用 ， 那 么 它 


从 标准 笨 和 人 中 讯 取 数 拓 ， 输 出 时 省 略 文件 各 。 例如: 


% cat intro.txt inter.txt | double 
10: the 

143: interface 

343: type 

544: if 


fea REDE, FP RA dp ARHAN, ilf HH AT E d 。 


下 面 我 们 看 看 double , HENRI (root chunk )， 程 序 的 每 个 组 成 部 分 用 其 


{WAR ER HAS: 


(double.c 4)= 
(includes 5) 
(data 6) 
(prototypes 6) 
(functions 5) 


为 了 方便 ， 恨 代码 块 用 程序 文件 名 标识 ;通过 展开 代码 块 <douBle.c 2 展开 程序 。 其 他 代码 
块 用 deuble 的 顶级 组 件 标识 。 这 些 组 件 按照 由 C 程 序 设计 语言 规定 的 次 序列 出 , 但 是 它们 可 


以 按 任何 次 序 给 出 。 


<double.c 4> 中 的 数字 4 是 代码 块 定义 开始 的 页 码 。 在 <double.c 4> 中 使 用 的 代码 块 中 的 


数字 是 它们 定义 开始 的 页 码 ， 这 些 页 码 有 助 于 读者 浏览 代码 。 
main 函数 处 理 qouble 的 参数 。 它 打开 每 个 文件 并 调用 doubleword 扫 质 文件 : 


(functions sys 
int main(int argc, char *argv[]) { 
int i; 


for (i = 1; i < argc; ie) 1 
FILE *fp = fopen(argv[i], "r"); 
if (fp == NULL) í 
fprintf(stderr, "Xs: can't open 'Xs' (%s)\n", 
argv[0], argv(i], strerror(errno)); 
return EXIT. FAILURE ; 


} else { r 
doubleword(argv[i], fp); 
fclose(fp); 

1 

















if (argc == 1) doubleword(NULL, stdin); 
return EXIT_SUCCESS; 
3 


(includes 5)= 
#include <stdio.h> 
#include <stdlib.h> 
#include <errno.h> 


BR doubleword HH MK HP PEL Mi], BPR. -个 单词 必须 是 一 个 或 多 个 无 空格 字 
符 , 并 日 不 区 分 大 小 写 。getword 从 -个 打开 的 文件 中 将 下 一 个 单间 读 人 buf[0..size-]] 并 返 
Ell; 读 到 文件 未 尾 时 ， 返 同 0。 


(functions 5j 
int getword(FILE *fp, char *buf, int size) í 
int c; 


€ = getc(fp); 
[5] (scan forward to a nonspace character or EOF 6) 
(copy the word into buf(0..size-1] 7) 
if (c t= EOF) 
ungetc(c, fp); 
return (found a word? 7); 





1 


(prototypes 6)= 
int getword(FILE *, char *, int); 

这 个 代码 块 说 明了 iiterate 编 程 的 另 一 个 特征 : 代码 块 标识 <functions S» FEBR “+ =” 
指出 getword 的 代码 是 附加 在 代 色 块 <fienctions 5> 后 的 .因此 代码 块 现在 包含 main 利 getword 
的 代码 。 这 个 特征 允许 “个 代码 块 中 的 代码 : -次 只 写 一 部 分 。 后 续 扩 充 定义 的 代码 块 标签 由 
的 页 玛 指 向 的 是 该 代码 医 中 的 第 一 个 代 吏 段 定义 ， 因 此 根据 它 可 以 很 容易 找到 一 -个 代码 块 定 
义 的 开始 。 

既然 getword 在 main 之 后 ， 因 此 存 main 中 调 川 8etword 需 要 - .个 原型 ， 这 也 就 是 代码 块 
«prototypes 9> 的 目的 。 这 个 代码 蕊 在 某 种 意义 上 可 以 说 是 对 C 的 必须 在 使 用 之 前 先 声 明 规则 
的 让 步 , 但 是 如 果 定 义 是 - 致 的 ,并且 在 根 代码 块 中 该 代码 块 出 现在 <functions 5> 之 前 ， 那 
么 函数 就 可 以 以 任意 次 序 给 出 。 

除了 从 和 输入 中 得 到 下 一 个 单词 ， getword 还 会 在 吉 到 换行 符 时 将 linenum 加 1， 
doubleword 会 在 品 示 输出 结果 时 使 用 linenum 。 


(data 6)= 
int linenum; 


(scan forward to a nonspace character or EOF 6)= 
for ( ; c != EOF && isspace(c); c = getc(fp)) 








Tinenum++; 


(includes 5)+= 
#include <ctype.h> 


jinenum 的 定义 给 出 了 一 个 与 C 要 求 的 顺序 不 - 样 的 例子 ,代码 块 可 以 按 任何 次 序 放 告 。 
在 这 里 ，linenum 是 在 第 -次 使 用 时 给 出 定义 ， 而 不 是 像 C 中 所 要 求 的 都 样 在 文件 的 开始 处 给 
出 或 在 定义 getword 之 前 给 出 

size 的 值 是 对 存储 在 getword 中 单词 长 诬 的 限制 ，getword 丢 充 多 余 的 字符 并 将 大 写字 符 
转换 成 小 写字 符 : 

(copy the word inta buf [0..size-1] 7)= 


t 
int i = O; 
for ( ; c != EOF && !isspace(c); c = getc(fp)) 
if (i < size - 1) 
buf [i++] = tolower(c); 
if (i < size) 
buf[i] = 'N0'; 
] 


RTU size -LE HORE, LET BURMA RUE ITE — 4-2 E ; if 语句 保证 赋值 操作 能 
够 处 理 size 为 0 的 情况 ,这 种 情况 在 double 中 不 会 发 生 ， 但 是 这 种 保护 性 编程 有 助 于 发 现 “不 
可 能 发 生 ” 的 错误 。 

getword FMT PAR: 如 果 buf 中 企 在 一 个 单词 就 返回 ] ， 其 他 情况 则 返回 0 ; 

(found a word? 7)= 

buf[0] i= '\o' 

这 个 定义 表明 ; BORA 定 要 与 C 语 多 或 任何 其 他 语 洁 的 语法 单元 相对 应 ,它们 只 是 简 
单 的 文字 描述 。 

doubleword 读 人 每 个 单间 ， 并 将 它 与 前 面 的 单词 做 比较 ， 判 断 昆 稍 重 复 。 它 只 检查 以 字 
REGE cfi jos: 

(functions se 


void doubleword(char *name, FILE *fp) { 
char prev[128], word[128]; 


linenum = 1; 
prev[0] = '\o'; 
while (getword(fp, word, sizeof word)) í 
if Cisalpha(word[0]) && strcmp(prev, word)--0) 
(word is a duplicate s) 
strcpy(prev, word); 


H 


(prototypes 6}= 
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void doubleword(char *, FILE *); 
(includes S 
#include <string.h> 
和 输出 结果 是 很 容易 的 ， 避 是 要 注意 ， 文 件 名 利 它 局 面 的 冒号 只 有 在 name 不 为 空 时 才 打印 : 
(word is a duplicate 8)= 
if (name) 
printf("%s:", name); 


printf("%d: %s\n", linenum, word); 
H 


这 个 代码 块 定义 为 一 个 合成 语句 ， 它 可 以 作为 使 用 它 的 站 语 名 的 结 类 出现 
1.2 编程 风格 


double 实 例 说 明了 本 书 许多 程序 中 所 使 用 的 格式 上 的 习惯 。 对 程序 来 说 ,更 重要 的 是 易 
FAI BEM BF, mF LAL SER VES INTERIUS EE ES EEG 
JE MUPTHE RE RU SURE PEALE RT AA RA. OL, COR ERA Re 
个 程序 有 很 大 的 影响 。 

本 书 中 的 代码 沿袭 C 程 序 的 格式 习惯 。 它 对 窑 量 、 类 天 和 例 程 的 命名 使 用 了 - 致 性 的 原 
则 ， 并 且 将 格式 限定 为 一 致 缩 进 风 作 。 格 式 寺 人 惯 并 人 不足 -组 必须 不 惜 任何 代价 去 遵循 的 严格 
规则 ， 它 们 表述 的 是 一 种 寻求 最 大 可 读 性 利 可 理解 性 的 编程 斩 学 。 内 此 ， 这 些 规则 可 以 在 任 
何 需 要 的 时 候 被 政变， 以 利于 强调 信 码 的 重要 方 喇 或 全 复杂 的 代码 更 具 可 读 性 。 

通常 ， 对 全 局 实景 和 例 程 使 用 匀 长 的 、 容 易 称呼 的 名 字 、 而 对 局 部 变 朋 用 短 的 名 字 ， 可 
能 就 是 普通 的 数学 记 全 的 翻版 。 在 <compute x - y> 中 的 循环 室 晤 就 是 后 一 种 习惯 的 例子 。 基 
于 近 于 传统 的 日 的 ， 对 索引 和 变量 使 用 长 名 通常 使 得 代码 更 难 读 懂 例如， 在 下 面 的 代码 中 ， 

sum = 0; 


for (theindex = 0; theindex < numofElements; theindex++) 
sum += x[theindex]*y[theindex]; 


EBE EAR VOR MEL 

变 其 都 是 志明 在 它们 第 -次 被 使 用 的 程序 代码 附近 ， 可 能 是 在 代码 块 中 。 例如 ， 
Betword 中 变量 linenum 的 声明 就 是 这 样 。 局 部 变 昔 尽 可 能 声明 在 使 用 它们 的 复合 请 句 的 开始 
处 ,例如 <copy the word into buf[0..size-1] 7> "ufi wy 

WE, ARARE AEN & IRE RE BLY PITT D S ROE LR. th, gctword:iE 
回 输入 中 的 下 AR, fidoubleword 48 JES n zb BUR AKH Bs] 。 大 多 数 例 程 都 很 短 ， 
代码 不 超过 -页 ; 代码 块 则 更 短 ， 通 常 不 到 12 行 - 

TOS HLT RAE TERE ， 内 为 包含 代 抬 的 代码 块 周 围 的 上 下 文 代替 了 了 注释， 对 注释 格 
ATR MERE BH. $ 书 遵 循 C 语 占 编 程 中 的 经 典 指导 ， 即 注释 尽 可 能 的 少 。 清晰 、 使 








ey ^ 7 





FASE a de VA 4a SEES GET (CIS ERE ES ENA EER RAH. fj 
如 数据 结构 的 细节 、 算 法 中 的 特殊 情况 以 及 异常 情况 等 等 。 编 译 器 不 能 检查 注释 和 代码 的 -- 
致 件 ; 可 能 产生 误 坚 的 注释 比 没有 注释 史 烧 。 最 后 ,都 些 杂乱 的 、 过 多 的 印刷 样式 中 的 注释 ， 
除了 给 代码 带 来 混乱 外 ， 其 他 什么 用 处 也 没有 - 

literate 编 程 避 免 了 人 在 注释 问题 中 的 许多 争论 , 因为 它 不 受 程序 设计 语言 注释 机 制 的 限制 。 
程序 员 可 以 使 用 最 能 传达 他 们 意图 的 任何 格式 ， 包 括 才 格 、 等 术 区 片 以 及 引用 。literate 
编程 提高 了 程序 的 止 确 性 、 精 依 性 和 清晰 度 。 

本 书 的 代码 是 而 C 编 写 的 ， 它 使 用 大 量 有 经 验 的 C 程 序 员 普 谤 接受 且 期 望 的 习惯 用 法 。 
其 中 一 些 对 新 手 来 说 也 许 会 有 些 迷 感 ， 但 是 他 们 如 果 想 熟练 使 用 C 的 话 就 必须 掌握 这 些 。 这 
些 可 惯用 法 还 包括 最 容易 混淆 的 指针 ， 因 为 C 对 指针 的 使 用 提供 了 几 个 独特 的 、 有 表达 力 的 
RE. HTF ERRE H -AFR RARE AR ER AE 函数 strepy 就 说 明了 老手 和 
新 手写 的 代码 之 问 的 差别 ， 后 音 的 代码 常 使 用 数组 : 


char *strcpy(char dst[], const char srcl]) 4 
int i; 





for (i = 0; src[i] {= 'NO'; i++) 
dst[i] = src[i]; 
dst[i] = 
return dst; 
J 
而 老手 习惯 使 用 指针 : 


char *strcpy(char *dst, const char *src) í 
char *s = dst; 


while (*dst++ = *src++) 
return s; 
J 
S RHUEHMstrepy( IERI SU, JEKI IERI SES ERNE, 它 把 指针 赋值 、 自 
增 以 及 测试 赋值 的 结果 融合 到 -个 单 的 赋值 表达 式 中 ， 它 同时 还 修改 了 它 数 dst 和 src ， 这 
在 C 中 是 可 以 接受 的 ， 因 为 所 有 的 参数 都 是 通过 值 传递 的 ， 也 就 中 说 参数 只 中 局 部 切 始 化 
然而 在 其 种 情况 下 应 该 选择 数组 版 本 而 不 足 指针 版 本 实现 ， 例如， 对 记 有 的 各 序 员 ， 不 
管 他 们 是 否 熟 悉 C ， 数 组 版 本 部 更 容易 理解 。 而 指针 版 本 是 藤 有 经验 的 C 程 序 员 常 常用 到 的 ， 
因此 也 是 程序 员 阅 读 现 存 代码 时 最 有 可 能 遇 到 的 ， 本 书 可 以 帮助 你 学 习 这 些 习 慌 用 法 ， 理解 
C 强 大 的 指针 ， 辟 免 犯 常见 的 错误 。 





1.3 效率 


程序 员 在 上 去 对 歼 党 有些 迷惑 他们 可 能 要 化 由 个 小 时 修改 代 秒 以 使 其 运行 得 更 快 ， 串 
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TERE, ORR Kipapi no. PEE EO I W AE EFE C h ç ECKE A EE 
常 不 准 的 。 

使 程序 运行 得 更 快 ， 往 往 也 使 得 程序 灾 得 越 来 越 大 ， 更 难 理解 的 是 ， 包 含 错误 的 吓 能 必 
也 更 大 。 除 非 对 执行 时 间 的 度量 显 上 出 穆 序 运行 得 太 慢 ， 舍 则 没有 必要 进行 这 样 的 改变 。 程 
序 只 需要 运行 得 足够 快 而 不 必 尽 可 能 的 快 。 

进行 这 样 的 改变 通常 是 存 未 经 测试 的 纯 编程 环境 中 完成 的 。 如 果 程 序 运行 得 太 慢 ， 找 到 
CRIN HOHE -方法 就 足 度量 它 。 一 个 程序 的 浙 诺 很 少 发 生存 你 猜想 它们 发 生 的 地 方 ， 也 很 
少 是 由 你 猜测 的 原因 引起 的 ， 即 使 你 找到 了 正确 的 地 方 ， 世 只 有 人 在 那 个 地 方 花费 的 运行 时 间 
占 运 行 总 时 间 的 很 大 一 部 分 时 才 需 要 进行 这 样 的 修改 。 如 果 1O 占 了 60% 的 程序 运行 时 间 ， 
那么 在 查询 例 程 中 节省 1% 的 运行 时 间 是 没有 任何 意义 的 。 

进行 这 样 的 调整 通常 会 引 和 人 错误 。 即 便 是 运行 最 快 的 程序 ， 如 果 运 行 时 出 省 也 不 能 算 成 
功 ， 因 为 可 靠 性 比 效 率 更 重要 。 从 长 远 来 看 ， 发 布 一 个 快 但 是 经 常 崩 泪 的 软件 比 发 布 一 个 运 
行 稳定 而 又 足够 快 的 软件 花费 更 大 。 

通常 ， 这 样 的 调整 是 在 有 问题 的 层次 上 完成 的 , 木 身 就 很 快 的 算法 的 占 慷 实现 要 优 丁 对 
本 身 运行 较 慢 的 算法 做 手工 调整 。 鲍 如 ， 压 缩 线性 查找 内 部 循环 外 的 指令 肯定 不 站 首先 使 用 
二 分 查找 更 有 效 。 

这 样 的 调整 不 能 改变 拙劣 的 设计 。 如 果 程 序 存折 有 的 地 方 运行 邦 慨 ， 那 么 这 种 低 效 去 现 
很 有 可 能 是 设计 本 身 的 问题 。 当 没 计 源 于 编写 得 不 好 战 不 准确 的 问题 说 明 书 或 根本 没有 进行 
总 体 设计 时 ， 常 常会 出 现 这 种 情况 。 . 

本 书 中 的 大 部 分 代码 郁 使 用 有 效 的 算法 ， 这 些 算法 在 一 般 情况 下 具有 良好 的 性 能 ， 而 月 
最 坏 情况 下 的 性 能 也 很 容易 刻画。 它们 在 大 部 分 应 用 中 对 典型 输入 的 执行 时 间 几 乎 总 旦 是 够 
RA: 在 某 些 应 用 中 ， 性 能 可 能 会 有 问题 的 情况 也 能 明确 识别 山 米 . 

一 些 C 程 序 员 为 了 追求 效率 而 大 量 使 用 宏 指令 和 条 件 编译 指 今 ， 本 - 书 尽 可 能 避免 使 用 这 
ARES. ATR BRA TUE CRRA EM, RAYE ER Re IWJ 
花费 可 能 超过 剩 下 代码 的 执行 时 间 时 才 有 必要 使 用 宏 指 令 。 IO 是 少数 儿 个 合理 使 用 宏 指 今 
的 地 方 之 一 ， 例 如 标准 的 MO 函数 gete pute, getcharüputcharifi © AE J5 2:18 AREAN , 

条 件 编译 语句 通常 用 来 设置 代码 以 适应 特定 的 平台 或 环境 ， 或 媳 来 关闭 或 打开 代码 的 调 
试 。 这 些 都 是 实际 存在 的 问题 ， 条 件 编译 语句 通常 是 解决 它们 的 最 简单 亡 法 ， 但 总 是 使 得 代 
码 更 难 懂 。 通 常 更 有 用 的 方法 是 重生 代 骨 来 实现 在 执行 的 过 程 中 选择 所 依赖 的 平台 。 例 如 ， 
可 以 选择 六 种 体系 结构 中 的 -种 ， 在 执行 期 间 产 后 代 倪 的 简单 编译 器 ， 即 交 义 编译 器 ， 比 必 
须 配置 和 构造 六 种 不 同 的 编译 器 要 有 用 得 多 ， 而 且 也 更 容易 维护 

如 果 -个 应 用 程序 必须 在 编译 时 间 内 进行 杞 锋 ， 版 本 控制 工具 也 比 C 的 条 件 编 兰 工具 昌 
好 。 代 磺 并 不 是 用 项 处 理 指令 给 出 的 ， 这 些 预 处 再 指令 使 得 代码 很 难 阅读 ， 并 中 不 清楚 蓝 纺 
谋 他 么 ， 不 要 编 将 什么 。 而 用 版 本 控制 工具 、 你 所 看 到 的 就 是 所 要 起 行 的 同时， 这 些 工具 
也 可 以 很 好 地 用 以 了 解 性 能 的 改进 。 
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参考 书目 浅 析 


ANSI 标 准 (1990 ) 以 及 技术 上 等 俐 的 ISO 标准 (1990 ) 是 标准 C 程 序 库 的 权威 性 参考 蔬 
目 ， 但 是 Plauger(1992) 给 出 了 -个 更 详细 的 描述 和 一 个 完整 的 实现 。 同 样 地 ， 这 些 标准 是 关 
总 缚 文章 ， 仙 是 Kernighan Ritchie ( 1988 ) 可 能 是 使 用 最 广泛 的 参 疙 书 ，Harbison 和 
Steele (1995) J AEETI ERRAR, MECE ESMAR “TARCE 
{elcan C)” —— EICAR EST] LIH C++ FERRINE. Jaeschke (1991) 将 标准 C 中 的 精华 精简 
成 紧 淡 的 字 暴 格式 ， 它 对 于 C 程 序 员 米 说 是 -本 非常 有 用 的 参考 书 。 

尽管 Kernighan 和 Plauger (1976) 用 特别 的 工具 包含 了 本 书 中 的 代码 ,但 他 们 的 软件 工 
只 却 给 出 本 早期 literate 答 序 的 例子 .WEB 是 明 确 为 literate 编 程 设计 的 最 嘻 的 工具 之 -， 
Knuth (1992) 叙述 TWEB 和 它 的 - 些 变种 及 使 用 ;Sewell (1989 ) 是 - -本 关于 WEB 的 介绍 
指南 。Simpler 工 具 (Hanson 1987; Ramsey 1994 ) We RE AE £ WEB MI Bot DORE A SEGA. 
本 书 使 用 notangle ， 它 是 Ramsey 的 howeb 系 统 中 一 种 展开 代码 块 的 程序 。noweb 同 样 也 被 
Fraser 和 Hanson (1995 ) 用 来 将 - -个 完整 的 C 编 译 器 表示 成 -个 ]iterate 程 序 。 这 个 编译 器 也 
足 一 个 交叉 编译 器 - 

double 摘 肥 自 Kernighan 和 Pike (1984 )， 是 用 AWK 程 序 设计 语 声 (Aho,Kernighan 和 
Weinberger 1988 ) 实现 的 。 尺 管 有 些 年 代 ， 仙 Kernighan 和 Pike 仍 然 钙 关于 UNIX 编 程 诛 理 
最 好 的 书 之 …。 

学 好 的 编程 风格 的 最 好 方法 就 是 阅读 使 用 好 的 风格 书写 的 程序 。 木 书 沿袭 了 在 
Kernighan #lPike (1984) 以 及 Kernighan 和 Ritchie ( 1988 ) 中 使 用 的 经 久 不 罕 的 编程 史 格 。 
KernighanfüPlauger (1978) 足 关 于 编程 风 属 的 最 经 典 的 KE, 但 是 它 没有 人 包含 任何 用 C 
写 的 例子 。Ledgard 的 简明 书籍 (1987 ) 提供 了 类 似 的 建议 ，Maguire (1993) 提出 了 -个 从 
PC 编程 世界 出 发 的 观点 。Koenig (1989) 揭 伙 了 C 的 缺陷 并 且 突出 说 明了 应 该 革 免 之 处 。 
McConnell (1993) 提供 了 关于 程序 构造 许多 方面 的 有 用 建议 ， 并 且 从 正太 两 方面 对 使 用 
8oto 语 名 进行 了 讨论 , 

学 习 编号 有 效 代 码 的 最 好 的 方法 是 对 算法 有 全 面 的 基础 知识 并 阅读 其 他 有 效 的 代码 
Sedgewick (1990 ) 研究 了 所 有 大 多 数 程序 员 应 该 知道 的 重要 算法 Knuth (1973a ) 给 出 了 
OR Fuk TE AMAT IE. Bentley (1982) 提供 了 170 页 的 NF ROT 88 3 AACS 09 36 EA 
建议 。 


练习 





11 一 个 单 闻 以 换行 字符 结 来 时 ，getword 函数 在 <scan forward to a nonspace or EOF 6> 
中 而 不 是 在 <copy the word into buf[0..size-1] 7> 之 后 将 linenumJ1， 涪 明理 有 由， 如 
果 lipenum 在 <copy the word into buf{0..size-1] 7> 之 后 加 1 LATHE? 

1.2 当 double 函 数 能 到 输入 沾 有 二 个 或 更 多 相同 单词 时 ， 输 出 结果 中 什么 ? 修 "double 
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函数 以 保持 这 个 特征 。 
13 许多 有 经 验 的 C 程 序 员 会 在 strepy 的 循环 中 进行 一 个 明确 的 比较 : 
char *strcpy(char *dst, const char *src) í 
char *s = dst; 


while ((*dst++ = *src++) != '\O') 
return s; 
} 
这 个 最 式 比较 避免 了 赋值 错误 。 一 些 C 编 详 器 和 相关 的 工具 ， 像 Gimpel 软 件 公司 的 PC-Lint 和 
LCLint (Evans 1996 )， 当 赋值 的 结果 被 用 作 条 件 时 会 发 名 警告 ， 因 为 这 种 使 用 方法 是 一 个 
常见 的 错误 来 源 。 如 果 你 有 PC-Lint 战 LCLint ， 可 以 对 一 些 “ 测 试 过 ”的 程序 做 这 个 实验 。 


第 2 章 ”接口 与 实现 


一 个 模块 出 两 部 分 组 成 : 接 !1 利 实现 。 接 口 指明 模块 要 做 什么 ， 它 声明 了 使 用 该 模块 的 
代码 可 用 的 标识 符 、 类 型 和 例 穆 ; 实现 指明 模块 是 如 何 完 成 其 接口 声明 的 目标 的 。 一 个 给 定 
的 模块 通常 只 有 一 个 接口 ， 但 是 可 能 会 有 许多 种 实现 能 够 提供 接口 所 指定 的 功能 。 每 个 实现 
可 能 使 用 不 同 的 算法 和 数据 结构 ， 但 是 它 们 都 必 须 符合 接 万 所 给 出 的 使 用 说 明 。 

客户 调用 程序 (client) 是 使 用 某 个 模块 的 “有 段 代码 。 客 户 调 用 程序 导入 接口 ;而 实现 
导出 接口 。 客 户 调用 程序 只 需要 了 解 接口 即 可 。 实 际 上 ， 它 们 可 能 只 有 其 个 实现 的 日 标 代码 。 
出 于 多 个 客户 调用 程序 是 共享 接 D 和 实现 的 ， 因 此 使 用 实现 的 日 标 代 公 避免 了 不必 要 的 代码 
重复 。 同 时 也 有 助 于 避免 错误 ， 办 为 接 11 和 实现 只 需 一 次 编写 和 调试 就 可 多 次 使 用 


2.1 接口 


接 司 只 需要 指明 客户 调用 程序 可 能 使 用 的 标识 符 即 可 ， 应 尽 TA h M- ib X AY o 
细节 和 算法 ， 这 样 客户 调用 程序 可 以 不 必 依赖 证 特定 的 实现 细节 。 这 种 客户 调用 程序 和 实现 
之 间 的 依赖 一 一 耦合 可 能 会 在 实现 改 安 时 引起 错误 ， 当 这 种 依赖 性 埋藏 在 - 些 关于 实现 
隐藏 的 或 是 不 明 伴 的 假设 中 时 ， 这 些 错误 可 能 很 难 修复 。 因 此 一 个 设计 良好 卓 描 述 精确 的 接 
口 应 该 尽量 减少 耦合 

C 语 言 对 接口 与 实现 的 分 离 只 提供 最 基本 的 支持 , 但 是 简单 的 约定 能 给 接口 /实现 方法 论 
带 来 巨大 的 好 处 。 在 C 语 言 中 ,接口 在 头 文件 声明 ， 头 文件 的 文件 扩展 名 通常 为 .h。 该 头 文 
侍 声 明了 客户 调用 称 序 可 以 使 用 的 宏 、 类 型 、 数 据 结构 、 变 景 以 及 例 称 。 用 户 用 C 语 言 的 巴 
处 理 指 令 药 nclude 导 人 接口 。 

下 面 的 例子 说 明了 本 书 的 接口 中 所 使 用 的 一 些 约定 。 接 口 

(aritn.n)= 

extern int Arith max(int x, int y); 
extern int Arith min(int x, int y); 
extern int Arith div(int x, int y); 
extern int Arith mod(int x, int y); 
extern int Arith ceiling(int x, int y); 
extern int Arith floor (int x, int y); 


声明 了 6 个 整 型 算术 函数 ， 实 现 则 提供 了 每 个 函数 的 定义 。 

该 接口 的 名 字 为 Arith , ss ME Mfr anh FED EL A IU RHI 
现在 接口 的 等 个 标识 符 中 。 这 个 约定 不 是 很 合适 ， 但 C 语 言 几 乎 没有 提供 其 他 的 选择 。 文 件 
TOE AS ATA A TE Be, aH. 六 ER 
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所 有 的 全 局 结构 、 共 用 体 以 及 核 举 慰 签 共 享 另 一 个 专用 名 字 空 间 。 在 “个 大 型 程序 中 ， 很 容 
易 在 其 他 不 相关 的 模块 中 使 用 相同 的 名 字 , 而 名 字 的 用 途 不 同一 种 避免 名字 冲 突 的 方法 就 
是 使 用 前 缀 ， 比 方 说 模块 和 名。 大 型 理 序 很 容易 就 有 几 于 个 全 局 标识 符 ， 但 是 通常 只 有 儿 上 百 个 
模块 。 模 鼎 名 不 仅 提 供 了 合适 的 前 绿 ， 而 且 还 有 助 于 整理 客户 调用 程序 代码 - 

Arith 接 口 还 提供 了 一 些 标准 C 函 数 库 中 没有 的 但 很 有 用 的 函数 ， 并 为 除法 和 取 模 提供 了 
良好 的 定义 ， 而 标准 C 中 并 没有 给 出 这 些 操作 的 定义 或 只 提供 基于 实现 的 定义 。 

Arith_min 和 Arith_max 返 回 其 整 型 参数 中 的 最 小 值 和 最 大 值 。 

Arith_div 返 回 y 除 以 x 得 到 的 商 ，Arith_mod 返 回 由 应 的 余数 。 当 x 和 y 同 为 止 或 同 为 负 时 ， 
Arith_div(z, y) Fit Tx/y，Arith_mod(x, y) ff xy. 布 当 操作 数 的 符 导 不 相同 时 ，C 的 内 级 
操作 的 返回 值 就 取决 于 具体 的 实现 。 当 y 等 十 0 时 ，Arith_div 和 Arith_mod 也 等 价 于 x/y 和 x%y。 

标准 C 认 为 只 要 x/y 合 法 , (x/y) .y+x9y 就 一 定 等 了 当 其 中 一 个 操作 数 足 负数 的 时 候 ， 
这 种 语义 允许 整数 除法 向 零 或 向 无 穷 小 取 整 。 例 如 ， 如 果 -13/5 等 本 2， 那么 标准 C 就 认 
为 -13%5 一 定 等 于 -13--13/5) + S=-13-(-2) + 5=-3; 但 是 如 果 -1315 等 于 -3 ， 那 么 _13%5 就 
等 十 -13- (-3) «5-2, 

因此 内 典 的 操作 只 对 正 操作 数 有 用 。 标 准 库 函 数 div 和 1ldiv 接 收 西 个 整数 或 长 申 数 作为 输 
入 ， 返 回 商 和 余数 ， 并 存 入 一 个 结构 中 相应 的 字段 quot 利 rem 。 其 诸 义 局 定义 好 了 ， 它 们 总 
是 向 零 到 整 ， 因 此 diy(-13,5).quot 总 是 等 于 -2。Arith_div 和 Arith_mod 的 语义 也 同样 定义 好 
f: 它们 总 是 趋 近 数 销 的 左 侧 取 整 ; 当 操作 数 符号 相同 时 趋 近 于 0， 而 当 操 作 数 的 符号 不 同 
时 赵 近 无 穷 小 ， 因 此 Arith_div(-13，5) 返 回 -3， 

Arith_div 和 Arith_mod 都 是 用 更 精确 的 数学 术语 定义 芥 。Arith_div(x, y) FOL EE Sz 
的 最 大 整数 ， 其 中 z 满 足 z ,7=r。 因 此 ， 若 z=-13 ,y=5 或 x=13 ,y=-5 ,那么 z=-2.6， 所 以 
Arith_div(-13,5) 的 结果 是 -3。Arith_mod(xey) 被 定义 为 x-y》 .Arith_div(x,y)， 因 此 Arith_mod 
(-13,5) 等 于 -13-5 « (-3)22, 

函数 Arith_ceiling 和 Arith_floor 遵 循 类 似 的 约定 。Arith_ceiling(xy) 返 回 不 小 于 实数 商 xy 
FY He BER, IArith floor(x,y)3E FAR MAM Aly KM. ARA 的 操作 数 ， 
Arith_ceiling 返 回 z? 数 轴 右 边 的 整数 ， 而 Arith_floor 返 四 xjy 数 轴 左 边 的 整数 。 例 如 ， 


Arith_ceiling( 13,5) = 13/5= 26 = 3 
Arith ceiling(-13,5) = -13/5 = -26 = -2 
Arith floor ( 13,5) = 13/5 = 26 = 2 
Arith_ftoor (-13,5) = -13/5 = -26 = -3 


ABLE, MER TRAA AAE, RE RN MAG Ae , (Che A Ee 
REO m e RO AE), KERERE ATE f 180158 a ee NM , —3 RE f 
准确 含义 被 错误 定义 或 根本 就 不 定义 。C 的 诸 义 弥补 了 这 些 泼 酒 。 设 计 良 好 的 接口 也 能 堵 上 
这 些 汤 渣 ， 对 于 缺少 定义 的 补充 定义 ,对 语言 声明 了 位 没有 定义 或 内 在 实现 定义 了 的 行为 也 
做 了 明确 的 判断 。 

Arith 并 不 只 是 一 个 为 了 显示 C 的 缺陷 而 刻意 构造 的 例子 ， 例 如 ， 对 于 包含 取 余 的 算法 ， 
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CRAM A, RAR TERT HEH RIE, REA EDS AO SUN-1, RNAF, fd 
1 FR BB AN AR. BERT, WMR EN- DPA RO; HR, MRO, MAiA 
MEN-L. KAR 

Arith mod(i + 1, N); 

Arith mod(i - 1, N); 

£i 081 的 正确 表达 式 。 表 达 式 i = (i+1)%N 同 样 也 是 正确 的 ， 但 是 ;=(i-1)WN 就 不 对 了 , 
因为 当 i 是 0 时 , {i-1D%N 可 以 是 -1 战 和 N-1。 程序 员 在 (-1)%N 返 回 N-1 的 机 器 上 使 用 (i-1)%NBJj、 
会 得 到 目 确 的 结果 ,但 是 将 代码 放 到 一 个 (-D9%AN 返 回 -1 的 机 器 上 运行 时 ， 得 到 的 结果 可 能 
会 让 他 们 感到 非常 吃惊 。 使 用 库 函 数 diy(x,y) 也 起 不 到 任何 帮助 作用 ， 它 返 四 一 个 结构 ， 结 
构 的 quot 和 和 rem 字段 保修 了 x/y 的 商 和 余数 。 当 i 是 0 时 ，div(i-1,N).rem 总 是 -1。 还 可 以 使 用 
i=(i-1+N)%N, 但 是 它 只 有 在 i-1+N 不 会 溢出 时 才能 使 用 ， 


2.2 sm 


i 
i 


uon 


一 个 实现 导出 一 个 接口 。 它 定义 了 必要 的 变量 和 函数 以 提供 接 11 所 规定 的 功能 ， -个 实 
现 扬 示 了 表示 的 细节 和 接口 给 出 的 特定 行为 的 算法 ,但 是 更 想 的 情况 是 ， 客 户 调用 程序 根本 
不 需要 看 见 这 些 细节 。 客 户 调用 程序 通常 是 遂 过 从 程序 库 中 调用 它们 来 完成 所 有 日 标 代 而 的 
一 个 接口 可 能 有 多 个 实现 ， 但 只 要 实现 符合 该 接口 ， 那 么 它 就 可 以 改变 和 而 不 会 对 客户 调 
用 程序 产生 影响 。 不 同 的 实现 可 以 提供 更 好 的 性 能 ， 例 如 ， 设 计 良 好 的 接口 可 以 避免 对 机 器 
的 依赖 性， 但 是 也 可 能 使 得 实现 必须 依赖 于 机 器 ， 因 此 对 使 用 俯 UTR AS REEL HE RT ERE SER [n] 
的 或 部 分 不 同 的 实现 。 
在 C 语 言 中 ， 一 个 实现 是 出 一 个 或 多 个 .ce 文 件 提供 的 。 一 个 实现 必须 提供 其 导出 的 接口 
所 指定 的 切 能 。 实 现 应 包含 接口 的 文件， 以 保证 它 的 定义 与 接口 的 声明 足 -- 致 的 。 然而 ， 
除 此 之 外 ，C 中 没有 提供 其 他 语言 机 制 答 查实 下 的 一 致 性 。 
和 接口 一 样 ， 本 书 中 描述 的 实现 也 有 如 arith.c 所 示 的 固定 格式 , 
(arith.o= 
#include "arith.h" 
(arith.c functions 19) 





(arith.c functions 19)= 
int Arith maxCint x, int y) { 
return x > y ? x : y; 


H 


int Arith minCint x, int y) í 
return x > y ? y: x; 
} 


Bk Y<arith.c functions ?79> 外 ， 小 太 其 他 实现 的 代码 块 可 能 命名 为 <dauta> 、 «types» 、 
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«macros», 、<prototypes> 等 等 。 如 果 不 会 产生 混淆 ， 代 码 块 中 的 文件 各 《 Rarith cS ) 可 以 


略 去 。 
当 Arith_diy 的 参数 的 符号 不 同时 ， 它 执行 除法 有 两 种 可 能 ， 如 果 按 趋 近 0 取 整 ， 且 y 不 能 
整除 x ， 那 么 Arith_div(x,y) 等 于 x/y-1; 否则 ，x/y 执 行 以 下 语句 : 
(arith.c functions 19}= 
int Arith div(int x, int y) { 
if (division truncates toward 0 20) 
&& (x andy have different signs 20) && x%y != 0) 
return x/y - 1; 
else 
return x/y; 
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在 前 面 一 节 的 例子 中 ， 用 -13 徐 以 5 ， 测 试 了 除法 取 整 的 方式 。 通 过 测试 x 与 y 哪 个 小 于 0 ， 
并 比较 测试 的 结果 ， 就 能 核对 符号 ; 
(division truncates toward 0 20)= 
-13/5 == -2 








(x and y have different signs 20)= 
(x < 0) != (y < 0) 


Arith_mod 可 以 按 它 所 定义 的 那样 实现 : 


int Arith_mod(int x, int y) { 
return x - y*Arith_div(x, y); 
3 


Arith_mod 也 可 以 使 用 “ 色 ”操作 符 对 Arith_divy 中 同样 的 条 件 进行 测试 。 当 那些 条 件 都 
成 立时 ， 


Arith mod(x,y) x - y*Arith div(x, y) 
x - y*Q/y - 1) 


x - y*(x/y) + y 


带 下 划 线 的 子 表达 式 就 是 标准 C 所 定义 的 x%y ， 因 此 Arith_mod 就 是 
tarith.c functions 19)+= 
int Arith_mod(int x, int y) { 
if Cdivision truncates toward 0 20) 
&& (x and y have different signs 20) && x%y != 0) 
return x%y + y; 
else 
return x%y; 


" Ú W 





) 


只 要 x 不 被 y 整 除 ， 那 么 Arith_floor 就 是 Arith_div ， 而 Arith_ceiling 就 是 Arith_div+1 








26 (arith.c functions 19)+= 








int Arith mod(int x, int y) { 


BOSE, 5 





return Arith div(x, y); 


) 


int Arith ceilingCint x, int y) { 
return Arith div(x, y) + Gy !- 0); 
} 


23 抽象 数据 类 型 


抽象 数据 美 型 (abstract data type, ADT ) Ë — + sE X Y 8 528 NARE FAAN f 8 
CERO BRE EH. — (ECHR REL HA. ECHR sh, Py RUN HE dE SERE. 
整数 、 浮 点 数 等 等 。 结 构 本 身 就 定义 了 一 种 新 的 类 型 并 且 可 以 用 来 形成 更 高 级 的 类 型 ， 例 如 
表 、 树 、 查 找 表 等 等 。 

一 个 高 级 类 型 是 抽象 的 ， 因 为 接口 隐 距 了 它 的 表示 细节 ， 只 说 明了 针对 该 类 型 值 的 合法 
操作 。 理 想 情况 下 ， 这 些 操作 并 不 揭 人 表示 骨节， 以免 客户 调用 程序 依赖 这 些 细节 。 一 个 抽 
象 数 据 类 型 (或 ADT ) 的 规范 化 例子 是 堆栈 。 它 的 接口 定义 了 该 类 型 及 其 五 种 操作 ， 


(initial version of stack.hy= 
#ifndef STACK_INCLUDED 
#define STACK INCLUDED 


typedef struct Stack T *Stack T; 


extern Stack T Stack new (void); 

extern int Stack empty(Stack T stk); 

extern void Stack.push (Stack T stk, void *x); 
extern void “Stack pop (Stack T stk); 

extern void Stack free (Stack T *stk); 


#endif 
typedef X. 了 Stack_T 类 型 ， 该 类 型 是 一 个 指向 有 相同 名 宁 标 签 的 结构 。 这 个 定义 是 合法 的 ， 
因为 结构 、 共 用 体 和 科举 标签 使 用 -个 名 字 空 间 ， 该 名 字 空间 号 从 变量 、 函 数 和 类 型 名 空间 
中 分 隔 出 来 的 ,这 种 用 法 将 贯穿 本 书 。 类 型 名 Stack_T 是 该 接口 所 关心 的 名 字 ; 这 个 标签 名 
也 许 只 对 实现 来 说 才 是 重要 的 。 使 用 相间 的 名 字 可 以 名 免 代 人 码 中 出 现 过 多 的 变量 名 ， 而 这 些 
变量 名 确实 用 得 很 少 。 

宏 STACK_INCLUDED 也 破坏 了 名 宁 空间 定义 惯例 ， 但 是 INCLUDED Ja RA MFE 
冲突 。 另 一 个 常用 的 约定 就 是 在 这 类 名 字 之 前 加 下 划 线 作为 前 经， 例如 _STACK 或 
-STACK_INCLUDED。 然 而 ,标准 C 保 留 了 前 下 划 线 以 便于 实现 和 将 来 的 扩展 ， 因 此 使 用 
前 下 划 线 一 定 要 谨慎 。 

这 个 接口 说 明 ， 堆 栈 是 用 指向 结构 的 指针 来 表示 的 ,但 是 它 并 没有 给 出 那些 结构 的 内 容 。 
Stack_T 是 一 个 隐 式 的 指针 类 型 ， 客 户 吝 用 程序 可 以 自 髓 地 操作 这 样 的 指针 ， 但 是 不 能 间接 
引用 它们 ， 也 就 是 说 ， 客 户 调用 程序 不 能 查看 出 该 类 型 指针 指向 的 结 格 的 内 部 内 容 ， 只 有 实 
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现 具有 这 个 特权 。 

隐 式 指针 降 藏 了 去 示 的 细节 而 且 有 利于 捕获 错误 。 只 有 Stack_T 能 被 传递 给 上 而 的 函 
数 ; 试 网 传递 共 他 类 型 的 指针 ， 例 如 指向 其 他 结构 的 指针 ， 都 会 产生 编译 错 误 。 惟 一 的 例外 
情况 是 空 指针 ， 它 可 以 传 给 任何 类 型 的 指针 。 

条 件 编译 指令 办 fdef 和 #endif， 以 及 STACK_INCLUDED 的 #define ， 使 得 stack.h 可 以 被 
包含 多 次 ， 这 种 傅 况 会 在 接口 导入 其 他 接口 时 出 现 。 如 果 没 有 这 种 保护 ， 第 一 次 和 接 下 米 的 
包含 者 将 引起 类 型 定义 中 Stack_T 重 复 定义 的 编译 错误 , 

在 少数 几 个 可 供 选择 的 约定 中 ， 这 种 续 定 可 能 息 最 好 的 。 禁 止 接口 包含 其 他 的 接 门 可 以 
完全 恕 免 重复 包含 的 情况 ， 但 是 这 就 要 求 接口 必须 采用 别 的 方法 将 其 他 接口 导入 、 例 如 在 注 
释 中 导入 ， 并 强迫 程序 员 握 供 包 含 。 将 条 件 编译 指令 放 在 安 户 济 用 程序 中 而 不 是 接口 中 ， 这 
样 可 以 避免 不 必要 的 接口 访问 ， 但 这 样 做 会 使 得 这 些 指令 出 现在 多 处 ， 而 不 像 以 前 ， 只 出 现 
在 接口 中 。 上 面 讲述 的 方法 将 使 得 编译 程序 做 更 多 的 工作 。 

按照 这 种 约定 ， 给 出 了 抽象 数据 类 型 定义 的 接口 X 将 被 命名 为 X_T。 本 书 中 的 接口 更 进 
一 步 加 强 这 个 约定 ,使 用 宏 将 X_T 在 接口 内 简写 为 T。 使 用 这 个 约定 ，stack.h 就 变 成 : 

(stack. n= 


#ifndef STACK INCLUDED 
#define STACK INCLUDED 








Xdefine T Stack T 
typedef struct T *T; 


extern T Stack.new (void); 

extern int — Stack empty(T stk); 

extern void Stack push (T stk, void *x); 
extern void *Stack pop (T stk); 

extern void Stack free (T *stk); 


#undef T 
Xendif 


语义 上 这 个 接口 同 前 一 个 接口 是 等 价 的 。 简 写 仅 仅 使 得 接口 更 容易 阅读 ; T 指 的 是 接口 的 一 
个 基本 类 型 。 然 面 客户 调用 程序 必须 使 用 Stack_T， 央 为 stack.h 未 尾 的 和 ndef 指 令 取消 了 这 
SAH. 

这 个 接口 提供 了 一 个 任意 指针 的 无 边界 堆栈 。Stack_new 产 生 一 个 新 的 堆栈 ,返回 一 个 了 
类 型 的 值 ， 该 值 可 以 传递 给 其 他 4 个 应 数 。Stack_push 将 指针 人 栈 ， 而 Stack_pop 移 出 并 返回 
栈 顶 的 指针 RAEN Stack emptyj& M, ， 和 否则 返回 0。Stack_free 接 受 指向 T 的 一 个 指针 作 
为 参数 ， 释 放 该 指针 指向 的 堆栈 ， 并 将 类 型 [的 变量 设 为 空 指针 。 这 种 设计 可 以 避免 出 现 悬 
空 指针 ， 即 指向 已 释放 空间 的 指针 。 例 如 ， 如 果 names 定 义 和 初 始 化 如 下 


finclude "stack.h" 
Stack T names = Stack_new(); 
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语句 

Stack_free(&names) ; 

PRT Eco nameshy HE eH Hnames it 7818 FT. 

(oA 88 28 ERE Bo Tet dean et, DUO HL TE RL ITA 
Stack THE 3g - -个 指向 结构 Stack_T 的 指针 的 原 办 。 本 书 中 大 多 数 的 抽象 数据 类 型 部 使 用 
类 似 的 定义 。 如 求 一 个 抽象 数据 类 型 给 出 了 它 的 表示 ， 并 导出 了 通过 值 接收 和 返 同 该 结构 的 
两 数 ， 却 么 它 必须 定义 该 接口 类 型 为 输出 的 类 型 。 第 16 章 中 的 接口 Text 说 明了 这 个 约定 ， 该 
接口 声明 Text_T 是 struct Text THR WHE XL BZ, TE OFRAR MHIS 


24 客户 调用 程序 的 责任 


接口 是 其 实现 与 客户 调用 程序 之 间 的 一 种 契约 。 实 现 必须 提供 接口 声明 的 功能 ， 而 客户 
调用 程序 必须 沪 照 接 己 中 描述 的 那些 显 式 或 隐 式 的 规则 来 使 用 这 些 功能 。 程 序 设计 语 计 提供 
本 一 些 隐 式 规则 米 管理 接口 中 声明 的 类 型 函数 以 及 变量 。 例 如 ，C 中 的 类 型 检查 规则 就 可 
以 捕手 到 类 型 错误 以 及 接 r1 函数 的 参数 数 日 方面 的 错误 。 

对 村 那些 C 几 法 中 没有 说 明 或 不 在 C 编 译 器 检查 范围 的 规则 、 就 必须 在 接口 中 子 以 说 明 , 
客户 调用 程序 必须 遵守 这 些 规则 ， 而 实现 也 必须 实现 这 些 规则 ， 接 口 通常 说 明 的 足 不 可 检查 
的 运行 期 错误 (unchecked runtime error )、 可 检查 的 运行 期 错误 (checked runtime error ) 以 
及 异常 (exception ) 情况 。 不 可 检查 和 中 检查 的 运行 期 错误 不 是 客户 调用 税 序 造成 的 ,例如 
打开 文件 销 认 等 等 ， 送 行 期 错误 也 是 客户 调用 程序 和 实现 之 问 韶 约 的 一 部 分 ， 是 不 可 恢复 的 
程序 销 误 。 异常 是 些 可 能 发 牛 但 很 少 会 发 目的 情况 ， 程 序 可 以 从 蜡 UTER, 我 们 将 在 第 
4 章 对 其 进行 详细 讲解 - 

不 可 检查 的 运行 期 错误 不 要 求实 现 能 够 检查 出 来 。 如 果 发 牛 了 不 可 检查 前 运行 期 错误 ， 
程序 可 能 继续 执行 ， 介 是 结 果 足 不 可 预测 的 ， 也 不 可 王 复 ， 好 的 接 ![ 应 尽 可 能 地 避免 出 现 不 
可 检查 的 运行 期 错误 ， 同 时 必须 说 明 那 些 可 能 发 生 的 木 可 检查 运行 期 错误 。 例 如 Arith 就 必 
须 说 明 被 0 除 是 个 不 可 答 查 的 送行 期 鲁 误 。Arith 可 以 检查 除数 是 否 为 0， 但 将 其 作为 -个 不 
可 检查 的 运行 期 错误 ， 这 样 可 以 让 它 的 函数 模拟 C 中 内 艇 的 除法 操作 行为 ，C 中 内 艇 的 除法 
操作 就 没有 要 求 检查 除 0 的 人 情况。 用 0 做 除数 的 另 一 个 合理 解决 方法 就 是 将 共 作 为 可 检查 的 运 
行 期 错误 - 

可 检查 的 运行 期 错误 是 实现 保证 能 够 检查 出 来 的 。 这 些 错误 说 明 ， 容 户 调用 程序 没有 苯 
守 某 部 分 约定 ; 避免 这 些 错误 基 客 户 调用 程序 的 责任 。Stack 接 门 就 指出 了 -种 可 检查 的 运 
行 期 错误 : 

(1) 向 接口 中 的 例 径 传 递 空 Stack_T; 

(2) 向 传 给 Stack_free 的 Stack_T 传 递 一 个 空 指针 ; 

(3) 或 将 -- 个 空 栈 传 给 Stack_pop 。 
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接口 也 可 以 指定 异常 以 及 引发 异常 的 条 件 。 正 如 第 4 章 中 解释 的 ， 客 户 调用 程序 可 以 处 
理 异 常 并 采取 正确 的 动作 ， 未 处 理 的 异常 将 被 当 作 可 检查 的 运行 错误 .接口 通常 列 出 由 它 帮 
其 导入 的 接口 所 引发 的 异常 。 例 如 ，Stack 接 口 导 入 了 Mem 接 门 ， 使 用 它 来 分 配 冠 间 ， 因此， 
它 声明 Stack_new 和 和 Stack_push 会 引发 异常 Mem_Failed 。 林 书 中 大 多 数 接口 郁 说 明了 类 似 的 
可 检查 运行 期 错误 和 异常 。 
有 了 这 些 Stack 接 口 的 附加 信息 ， 我 们 就 可 以 米 看 看 它 的 实现 了 : 
(stack.c)s 
#include «stddef.h» 
#include "assert.h" 


#include "mem.h" 
#include "stack.h" 


#define T Stack T 


(types 25) 
(functions 26) 


#define 指 令 重新 将 I 实例 化 作为 Stack_T 的 篇 写 。 实 现 揭示 了 Stack_T 的 内 容 ， 其 内 部 是 个 结 
构 ， 该 结构 有 个 字段 指向 一 个 栈 内 指针 的 链表 以 及 一 个 这 些 指针 的 计数 。 


《types 25)= 
struct T í 
int count; 
struct elem ( 
void *x; 
struct elem *link; 
} *head; 
J; 


Stack_new 分 配 并 初始 化 -个 新 的 T: 


(functions 26)= 
T Stack_new(void) í 
T stk; 


NEW(stk); 
stk->count = 0; 
stk->head = NULL; 
return stk; 

1 


NEW 趾 Mem 接 口中 的 一 个 分 配 宏 指令 。NEW (p) 将 分 配 该 结构 的 ~ 个 实例 ， 并 将 其 指针 
赋 给 p ， 内 此 ， 在 Stack_new 中 使 用 它 就 可 以 分 配 -个 新 的 Stack_T 结 构 。 
当 count 为 0plstack_empty 返 回 | ， 否 则 返回 0; 


(functions 26)+= 
int Stack_empty(T stk) { 
assert(stk); 
return stk->count == 0; 


# 2 5 RE 
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assert(stk) 实现 了 可 愉 查 的 色 行 期 错误 ， 它 禁止 空 指名 传 给 Stack 中 的 任何 函数 ，assert(e) 尼 
一 个 断言 ， 它 确保 表达 式 e 不 为 0。 如 果 e 不 为 0， 那 么 它 什 么 也 不 做 ， 和 否则 将 停止 程序 的 运行 ， 
assert 是 标准 库 函 数 的 一 部 分 ,位 是 第 4 章 中 的 Assert 接 口 定 义 了 它 自 己 的 具有 类 似 语义 的 


assert, ， 并 提供 了 半 稳 的 程序 终 小 - assert 用 米 检查 所 有 的 可 检查 运行 期 销 误 。 
Stack_push 和 Stack_pop 从 stk->head 所 指向 的 链表 的 头 部 庄 加 或 移出 元 素 : 


(functions 26)+= 
void Stack.push(T stk, void *x) Í 
struct elem *t; 


assert(stk); 

NEW(t) ; 

t->x = x; 

t-»link = stk->head; 
Stk->head = t; 
stk->count++; 


} 


void *Stack_pop(T stk) { 
void *x; 
struct elem *t; 


assert(stk); 
assert(stk->count > 0); 
t = stk->head; 
stk->head = t-»link; 
Stk-»count--; 

X = t->x; 

FREE(t) ; 

return x; 


了 


FREE 是 Mem 的 释放 宏 指 令 ; 它 释 放 指 针 参 数 所 指向 的 空间 ， 然 后 将 参数 设 为 空 指针 、 


Stack_free 所 考虑 的 一 样 一 一 避免 出 现 悬 空 指针 。Stack_free 也 调用 FREE ; 


(functions 26)+= 
void Stack free(T *stk) { 
struct elem *t, *u; 


assert(stk && *stk); 
for (t = (stk)->head; t; t - u) ( 
u = t->link; 
FREECt); 
} 
FREE(*stk); 
了 


这 同 


此 实现 展示 了 本 书 中 所 有 的 ADT 搂 口 都 会 遇 到 的 一 个 不 可 检查 运行 期 错误 ， 故 未 给 出 说 
明 。 我 们 没有 方法 保证 传 给 Stack_push 、Stack_pop、Stack_empty 的 Stack_T 利 传 给 
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Stack_free 的 Stack_T* 是 由 Stack_new 返 回 的 有 效 的 Stack_T。 练 习 2.3 探 讨 了 针对 这 个 问题 的 
部 分 解决 办 法 。 

还 有 两 个 不 可 检查 的 运行 期 错误 ,它们 的 影 嘛 串 能 中 细微。 本 书 中 的 许多 ADT 都 会 过 到 
裕 指 针 ; 世 就 是 说 ， 它 们 存储 并 返回 空 指针 。 在 任何 ADT 中 存储 一 个 函数 指针 ， 即 指向 一 个 
函数 的 指针 ， 就 是 一 个 不 可 检查 的 运行 期 错误 、 空 指针 是 “个 普通 的 指针 ，-- 个 void* 类 型 的 
变 有 旺 叮 以 存储 指向 任意 对 象 的 指针 ， 包 括 顶 定义 类 型 、 结 构 以 及 指针 ,函数 指针 则 不 同 ， 虽 
然 许 多 C 编 府 器 允许 将 函数 指针 赋值 为 一 个 空 指针 , 们 是 并 不 保证 空 指针 可 以 存储 函数 指针 。 

任何 对 象 指针 可 以 通过 宣 指 针 进 行 传播 ， 且 不 委 失 任何 信息 。 例 如 ， 质 行 下 列 说 名 之 后 : 

S *p, *q; 

void *t; 

t 

q 
对 任何 非 两 数 类 型 $ PANG ALANAE M. IHR. SIRE AYE UR EERO RR. BED. PERL 
TEARS AE. 

$ *p; 


D “qi 
void *t; 


p 
t; 


"ow 





9 不 一 定 等 于 p。 出 于 类 型 S 和 D 的 边界 济 整 限制 ，q 可 能 是 一 个 指向 类 型 D 的 某 个 对 象 的 容 指 
$r. 在 标准 C 中 ， 空 指针 和 字符 指针 有 相同 的 大 小 和 表示 ， 但 是 其 他 的 指针 可 能 会 小 一 些 或 
ARM AS. 因此， 在 ADT 中 存储 -个 指向 S 的 指针 ， 亿 是 将 它 取出 赋 给 类 弄 D 的 变量 ， 
而 S 和 D 义 是 不 同 的 对 象 类 型 ， 这 就 会 号 笋 一 个 不 H 检 查 的 运行 期 错误 。 

当 ADT 两 数 不 会 修改 指针 所 指 对 象 时 ， 卢 明 一 个 常 基 型 隐 式 指针 参数 是 很 有 可 能 的 。 Ll 
如 ，Stack_empty 可 以 写成 以 下 的 形式 : 








int Stack_empty(const T stk) í 
assert(stk); 

; return stk->count == 0; 
但 这 样 使 用 const ( 常量 定义 ) R: IE I. Habt 目的 足 把 stk 声 明成 -个 “指向 不 可 改变 
的 struct 了 的 指针 "， 因 为 Stack_empty 并 不 修改 *stk 。 但 是 const T stk 声 明 stk 为 一 个 “指向 
Struct 了 的 常量 指针 "， 也 就 是 说 T 的 类 型 定义 将 struct T* 包 装 成 一 个 单一 类 型 ， 而 该 整个 类 
型 的 操作 数 是 -个 常数 。const T s 录 对 Stack_empty 和 它 的 调用 者 来 说 是 没有 用 的 ， 因 为 所 有 
的 标量 《包括 指针 ) 在 C 中 都 是 通过 值 传 递 的 。 Stack_empty 不 可 能 改变 调用 者 实 参 的 值 ， 不 
管 参数 是 带 还 足 不 带 const 限 制 符 。 
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通过 用 结构 T* 代 项 T， 可 以 避免 这 个 问题 : 
int Stack_empty(const struct T *stk) { 
assert(stk); 
return stk->count == 0; 
了 
这 种 使 用 方法 说 明了 为 什么 const 不 应 该 用 在 指向 ADT 的 指针 中 : 它 暴露 了 部 分 实现 ,进而 限 
制 了 采用 共 他 可 行 方法 的 可 能 性 ， 对 Stack 的 这 个 实现 来 说 ， 使 用 const 不 会 右 什 么 问题 , 们 是 
这 样 做 排除 了 其 他 可 行 的 方法 - 假设 为 了 重复 使 用 栈 元 素 ， 需 归 推 迟 释放 栈 元 素 ， 在 调用 
Stack empty RIF Fg]. XX Stack empty ll Sc MMA ZE me tstk . 但 是 它 不 能 进行 修改 ， 
因为 st 偿 被 声明 为 const。 本 书 中 ADT 均 不 使 用 const。 


2.5 效率 


本 书 中 大 部 分 接口 的 实现 所 使 用 的 算法 和 数据 结构 ， 其 平均 运行 时 间 都 与 y 上 成 线性 关系 
RER (其 中 N 呈 接口 输入 的 大 小 )， 而 且 大 部 分 部 可 以 处 理 大 型 的 输入 , 对 不 能 处 理 大 型 
输入 的 接口 或 者 理 些 将 性 能 作为 一 个 很 重要 的 考虑 因素 的 接口 都 指定 了 一 个 性 能 标准 
(performance criteria ), 实现 必 须 达 到 这 些 标 准 ， 而 客户 询 几 程序 可 以 期 望 其 性 能 与 指定 的 
标准 - HAB, S EH Beta 的 性 能 ， 

本 书 中 的 所 有 接口 采用 的 足 简 单 的 但 有 效 的 算法 。 当 很 大 时 更 复杂 的 算法 和 数据 结构 
可 能 会 有 更 好 的 性 能 ,得 是 W 通 常 部 很 小 。 因此 大 多 数 实现 部 使 用 了 基本 的 数据 结构 像 数 组 、 
ER, WIR, VAAR ELH H 

本 书 中 除了 少数 几 个 ADT， 上 其 他 的 类 型 定义 都 使 用 了 隐 式 指针 ， 因 此 像 Stack_empty ix 
样 的 消 数 部 可 以 用 于 沪 问 被 实现 隐藏 的 字段 。 山 二 是 调用 函数 而 不 是 直接 访问 字段 ， 所 以 
对 实际 应 用 性 能 的 影响 通常 是 可 以 忽略 不 计 的 。 针 对 可 靠 性 及 尽 可 能 地 找到 运行 期 错误 方面 
的 改进 措施 都 足 值得 ABAS, ， 鞭 价值 远 超过 在 性 能 上 的 改进 所 能 党 来 的 微小 价值 , 

如 果 客 观 的 度 鞭 表明 性 能 的 改进 傅 实 是 必要 的 ， 那 么 它们 就 应 该 在 不 改变 接口 的 前 提 下 
进行 改进 ， 例 如 通过 定义 宏 指 令 ， 当 这 种 方法 不 可 行 时 ， 最 好 创建 一 个 新 的 接口 ， 并 说 明 它 
的 性 能 比 修改 一 个 已 在 在 的 接 1 更 有 效 ， 修 改 一 个 已 存在 的 接口 会 使 得 所 有 调用 它 的 客户 湖 
用 程序 都 变 成 元 效 的 客户 调用 程序 。 


参考 书目 浅 析 


过 程 和 隔 数 库 的 重要 性 从 1950 午 代 就 被 认识 到 了 。Parnas (1972) 就 是 -篇 关于 如 何 将 
一 个 程 订 划 分 成 多 个 模 基 的 经 典 文章 ， 这 篇 论文 已 有 20 多 年 了 ， 然而 它 却 陈述 了 程序 员 今天 
还 要 而 对 的 问题 。 

C 程 序 员 竺 天 都 化 使 用 接口 ; C 语 言 库 就 是 一 个 拥有 15 个 接口 的 集合 。 标准 JO 接口 一 stdio.h， 








定义 了 一 个 ADT- 一 FILE 以 及 对 FILE 指 针 的 各 项 操作 。Plauger (1992) 给 出 了 这 15 个 接口 [39] 
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以 及 其 匹配 的 实现 的 详细 说 明 ， 和 本 书 中 介绍 的 一 系列 接口 和 实现 所 用 的 方法 很 相似 -。 

Modula-3 是 一 门 相对 比较 新 的 程序 设计 语言 ， 它 在 语言 上 支持 接口 和 实现 的 分 离 ， 并 有 
它 是 本 书 中 使 用 的 基于 接口 技术 的 起 源 (Nelson 1991 )。 人 不 可 检查 和 可 愉 查 的 运行 期 错误 的 概 
念 以 及 ADTrhT 的 概念 都 来 自 Modula-3 。Harbison (1992 ) 中 一 在 介绍 Modula-3 的 教科 书 。 
Horning et al. (1993 ) 描述 了 Modula-3 系 统 中 的 核心 接 门 À 书 中 的 部 分 接口 就 是 根据 部 些 接 
LIKE BJ, Roberts ( 1995 ) 的 书 将 基于 接口 的 设计 作为 计算 机 课程 介绍 性 教学 的 组 织 原则 。 

断言 的 重要 性 也 是 被 广泛 承认 的 ，-- 些 程序 疫 计 语 言 ， 像 Modula-3 Eiffel (Meyer 
1992 ) 都 在 语言 中 媒人 了 断言 机 制 。Maguire ( 1993 ) 用 了 一 整 章 的 篇 幅 来 介绍 C 语 言 程序 
设计 中 断言 的 使 用 。 

很 多 熟悉 面向 对 象 程序 设 计 的 程序 员 可 能 会 认为 : 木 节 中 的 大 多 数 ADT 都 可 以 〈 也 许 会 
更 好 ) 作为 面向 对 象 程序 设计 语言 中 的 对 象 来 提出 ， 像 C++ (Elis 和 Stroustrup 1990) 和 
Modula-3, Budd (1991) 是 一 本 关于 面向 对 象 程序 设计 方法 以 太一 些 曾 向 对 象 程序 设计 语 
言 (包括 C++ ) 的 介绍 指南 。 本 书 中 说 明 的 接口 设计 原则 对 面向 对 象 程序 设计 语 半 问 样 适用 。 
例如 ， 用 C++ 重 写 木 书 中 的 ADT， 对 从 C 转 换 到 C++ 的 程序 员 来 说 ， 就 是 一 个 很 有 用 的 练习 。 

C++ 标准 模板 库 (STL ) 提供 了 类 似 于 本 书 中 所 描写 的 ADT。STEL 充 分 利用 了 C++ 模板 ， 
用 具体 的 类 型 将 ADT 实 例 化 (Musser 和 Saini 1996 )。 例 如 ，STL 提 供 了 一 个 向 量 (vector ) 
数据 类 型 的 模板 ， 它 可 以 用 于 实例 化 整数 向 量 、 字 符 申 向 景 等 等 。STL 同 时 也 提供 了 一 套 函 
数 ， 用 于 操作 由 模板 产生 的 数据 类 型 。 








练习 


2.1 预 处 理 宏 指 令 和 条 件 编译 指令 ， 像 # 这， 可 以 用 于 指定 Arith_div 和 Arith_mod 中 除法 
是 如 何 取 整 的 。 解 释 为 什么 -13/5 == -2 是 执行 测试 的 个 较 好 的 方法 。 

2.2 在 Arith_div 和 Arith_mod 中 使 用 的 测试 -13/5 == -2 只 有 在 arith.c 的 编译 器 采用 和 调 
用 Arith_ div 和 Arith_mod 时 一 样 的 工作 方式 进行 算术 运算 时 才 有 效 。 但 是 这 个 条 件 
可 能 并 不 成 立 ， 例 如 用 运行 在 机 器 X 上 的 交叉 编 详 器 来 编译 arithc ， 并 生成 机 器 Y 
的 代码 。 不 使 用 条 件 编译 指令 修改 arith.c， 以 使 得 上述 用 交叉 编译 生成 的 代码 也 能 
正常 工作 。 

23 与 本 书 中 所 有 的 ADT 一 样 ，Stack 接 口 省 略 了 这 样 的 说 明 “ 传 递 一 个 外 部 Stack_T 到 
接口 中 的 任何 
俱 程 是 一 个 不 可 检查 的 运行 期 铺 误 "。 一 个 外 部 Stack_T 是 指 它 不 是 由 Stack_new 产 
生 的 。 试 修改 stack.c 使 得 它 可 以 检查 这 种 错误 的 发 生 。 例 如 ， 一 种 方法 就 是 在 
Stack_T 的 结构 中 增加 一 个 字段 ， 保 存 一 个 由 Stack_new 返 回 的 对 每 个 Staek_T 是 惟 
一 的 位 模式 。 

24 通常， 检查 某 种 无 效 指针 是 可 能 的 。 例 如 ， 如 果 一 个 非 空 指针 指向 一 个 客户 调用 程 
序 地 址 空间 以 外 的 地 址 ， 邦 么 它 就 是 无 效 的 ， 而 月 指针 通常 要 满足 边界 对 齐 限 制 ; 
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例如 ， 在 某 些 系统 上 一 个 指向 双 精 度数 的 指针 必须 是 8 的 倍数 。 设 计 一 个 系统 专用 
的 家 指令 isBagPtr(p)， 使 得 当 P 足 个 无 效 指 针 时 ，assett(Ptr) 语 句 可 以 被 类 似 
assert(!isBadPtr(pit7)) 这 样 的 断言 来 取代 。 

2.5 对 堆栈 有 许多 可 行 的 凄 口 ， 设 计 并 实现 儿 个 其 他 可 行 的 Stack 接 口 。 例 如 ， 一 种 方 
法 是 指定 -个 最 大 的 尺寸 作 为 Stack_new 的 参数 。 





Be 原 子 


原子 是 一 个 指 疝 惟 的、 不 可 改变 的 0 个 或 任意 多 个 字 节 序列 的 指针 ， 大 多 数 原 王 部 是 
指向 以 空 字符 结束 的 字符 毕 ， 保 是 任何 一 个 指向 任意 字 节 序列 钓 指 外 都 可 以 是 原子 。 企 何 原 
FAR RAE HE K, ROBE OW HEA COR REE UU J. WEHI RFA I). A 8 o 
Bb, WU WS A SEAN, PUA ERIA E EPIRUS AG FE, 就 可 以 判断 这 两 
个 字 节 序列 是 否 相等 了, 这 是 使 用 原子 的 好 处 之 一 。 另 一 个 好 处 就 是 使 用 原子 可 以 节省 空间 ， 
因为 每 个 序列 只 会 出 现汇， 

SRP 38 9 BS PEROT Fun 0925 ESE UR, te BUR eR RB 
整数 来 索引 的 。 第 8 和 第 9 章 中 叙述 的 才 和 集合 就 是 这 方 断 的 例子 。 





3.1 接口 


Atom 接 口 很 简单 ， 


(atom. hy= 
#ifndef ATOM INCLUDED 
#define ATOM INCLUDED 


extern int Atom length(const char *str); 

extern const char "Atom new (const char *str, int len); 
extern const char *Atom string(const char *str); 

extern const char *Atom int Cong n); 


#endif 


Atom. new Hl — 4-48 i F TOP HU RS JE ALL SPP BUE BE A CERTE PIO 
SKEIRU, JEB RR Ad P, BA AFR T He ik H £F BU), 
Atom. new jk iis eR Fl Sait RTU T. WACTER SII IE FE AA 
RE, ECP MEWS, EB ER RIK SF EH Atom. new in 。 

Atom string jAtom_newž i, EAH TIN PME IG. E PEK 
RMT RG NA ARTI IARNA. RAY, Ra 
Atom intg F| K BROT TO dez fr eo f. RAFI PR RES, 
Atom, lengthi& [s] Hj FSIK E. 

YE— T EEA HE CIE TI SRI, 传递 一 个 负 的 len 值 给 Atom_new， sË f 
递 一 个 不 足 原 子 的 指针 给 Atom_length， 这 些 都 是 可 检查 的 运行 期 错误 ;而 试 周 修改 原 了 所 
指向 字 节 的 内 容 ， 则 吓 不 可 俭 伍 的 运行 期 销 谨 。Atom_length 执 行 所 化 费 的 时 间 与 原子 的 数 
目 成 比例 .Atom_new 、Atom_string 以 及 Atom_int 部 可 能 会 引发 Mem_Failed 异 营 。 
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3.2 实现 


Atom 的 实现 对 原子 表 进 行 维护 。Atom_new 、Aiom_string 以 及 Atom_int 查 找 原 子 表 ,并 
且 都 有 可 能 在 康子 表 中 添加 一 个 新 的 匹 素 ， 而 Atom_length 仅 仅 查找 原子 表 。 


(atom.c= 
(includes 34) 
(macros 37) 
(data 36) 
(functions 35) 


(includes 34)= 
#include "atom.h" 


Atom, string 和 Atom_int 可 以 在 不 知道 原子 表 的 表示 细节 的 情况 下 执行 相应 操作 。 例 如 
Atom_string 就 仅 仪 调用 Atom_new: 


(functions 35)= 
const char *Atom string(const char *str) í 
assert(str); 
return Atom new(str, strlen(str)); 
i 


(includes 34)+= 
#include <string.h> 
finclude "assert.h" 


Atom_int 首 先 把 它 的 参数 转换 成 一 个 字符 中 ,然后 调用 Atom_new: 


(functions 35)+= 
const char *Atom int(long n) { 
char str [43]; 
char *s = str + sizeof str; 
unsigned long m; 


if (n == LONG MIN) 

m = LONG MAX + 1UL; 
else if (n « 0) 

m= -ni 
else 


do 
*--s = mX10 + '0'; 
while (Cm /= 10) > O); 
if (n < 0) 
tas = tots 


return Atom new(s, (str + sizeof str) - s); 
H 


(includes 344 
#include <limits.h> 
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Atom_int 必 须 处 奋进 制 补 码 数 的 不 对 称 范 周 以 及 C 的 除法 和 缀 余 运 算 的 不 确定 性 。 无 
符号 的 除法 和 取 余 都 具 有 恨 好 的 定义 ， 内 此 Atom_int 也 可 以 通过 使 用 大 符号 算术 来 避免 使 用 
有 符号 运算 引起 的 不 确定 性 ， 

旷 小 的 负 长 整数 的 绝对 值 不 可 能 被 表示 出 来 ， 因 为 在 一 进 制 补 码 又 统 中 ,负数 比 正 数 多 
一 个 。 因 此 在 Atom_new 将 把 它 参 数 的 绝对 值 赋 值 给 无 符号 长 整数 m 之 前 ， 它 必须 先 和 检测 这 
个 异常 情况 。LONG_MAX 的 值 存在 标准 头 文人 limits.h rf 

loop 循 环 从 左 到 右 形 成 m 的 十 进 制 字符 中 表 术 ; 它 计算 最 右边 的 数字 ， 用 10 去 除 m， 并 
且 - 让 继续 至 做 到 年 值 变 为 0。 计算 出 的 每 .个 数 宁 ， 将 被 在 人 --s 中 ，s 在 str 中 是 向 后 移动 
的 。 如 果 n 是 负数 ， 都 么 会 在 学 符 串 的 开始 处 存 一 个 负 号 ， 

转换 完成 以 后 ,s 指 向 所 表示 的 字符 串 ， 这 个 字符 溃 有 上 str[43] -s 个 字符 ,str 有 43 个 字符 ， 
这 对 任何 机 器 上 的 任何 整数 的 十 进 制 胡 示 来 说 都 足够 了 了 。 例 如 ,我 们 假定 长 整数 的 长 度 是 
128 位 ， 对 任何 128 位 的 八进制 ( 以 8 为 底数 ) 有 符号 整数 的 字符 由 表示 需要 128/3+1=43 个 字 
符 。 十 进 制 表 示 的 数字 不 会 比 八进制 的 表 公 需要 的 字符 数 多 ， 由 此 43 个 字符 足够 了 。 

str 和 定义 中 的 43 是 一 个 “魔术 数 ”( magic number )， 通 常 有 更 好 的 方式 来 定义 这 类 值 的 符 
号 名 ， 以 确保 同样 的 值 能 够 在 各 处 使 用 。 然 而 ， 这 儿 的 值 仅 出 坝 -次 ,在 任何 需要 使 用 该 值 
F9 RIT REE sizeof KARE. EL MELAS (EA, (B Ex Aa 
EK, GA FEMS AL, TEPE, REENA KY ERARE EE na 一部分 
时 省 定义 符号 化 的 名 宁 。 散 列表 的 长 度 buekets 小 于 2048 ， 就 是 遵循 这 种 习惯 的 男 一 个 例子 、 

WIN IR -个 针对 原子 表 的 数据 结构 ， 获 列 表 是 AAO RRRA, JP RA 
一 个 元 素 都 存 有 “个 原子 : 

(data 36)= 

static struct atom { 
struct atom *link; 
int len; 
char *str; 
} *buckets [2048]; 
buckets[i T 988 & $e 48828 ROME Win AU Blink PL ZEAE -个 入 口 、len 存 储 序 
列 的 长 度 、str 指 向 序列 木 身 。 例 如 ,在 字 长 为 32 、 字符 长 度 为 8 的 小 尾数 法 计算 机 上 , 
Atom_string( “an atom" ) 4B — 1- All 3-1 Aizk struct atom, FRIAR Pese. 每 一 
个 入 口 都 有 是 够 大 的 宗 间 存储 它 的 序列 3-287 TAIR AR . 

Atom_new 计 算 由 str[0.len-1] (如 果 len 为 0 时 ， 是 -个 空 序列 ) MrRUT UON IR, 36 
用 buckets 的 元 索 个 数 闪 其 取 模 ， 搜 索 由 buckets 中 该 散 列 值 元 家 所 指向 的 链表 。 如 果 发 现 
str[0..len-1] 已 在 在 于 琢 巾 ， 它 将 只 是 简单 地 返回 该 原子 : 

(functions 35)+= 

const char *Atom_new(const char “str, int len) í 


unsigned long h; 
int i; 








35 











36 














struct atom *p; 


assert(str); 
assert(len >= 0); 
(h e hash str[0..len-1] 39) 
h &= NELEMS(buckets)-1; 
for (p = buckets[h]; p; p = p->link) 
if (len == p->len) í 
for G 0; i < len & p->str[i] == str[i]; ) 
i++; 
if G == Ten) 
return p->str; 


{allocate a new entry 39) 
return p->str; 


} 


(macros 37)= 
#define NELEMS(x) ((sizeof (x))/(sizeof ((x)[01))) 


NELEMS 的 定义 说 明 名 的 一 个 常用 习 慌 :数组 中 无 素 个 数 等 于 数组 的 大 小 除 以 每 个 元 
RRA sizeof E 个 编译 阶段 的 操作 ， 故 该 计算 只 能 在 编译 时 已 经 知道 了 数组 的 大 小 时 
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才 可 以 使 用 。 如 定义 中 所 演示 的 ， 在 宏 内 使 用 的 宏 参 数 都 用 斜体 商 兴 显示 。 
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图 3-1 针对 “an atom” pQstruct atom 的 小 尾数 法 布局 


如 果 stir[0..len 1] 不 在 表 中 ，Atom_new 将 分 配 -个 struct atom 和 足够 的 附加 空间 以 存储 
序列 ， 将 其 添加 到 表 中 ， 并 将 str[0..len -1] 拷 由 到 附加 空间 中 ， 添 加 新 的 人 口 到 buckets[b] 中 
链表 的 表 头 。 和 人 口 可 以 被 附加 到 链表 的 表 尾 ， 人 各 是 将 其 加 到 链 不 的 表 头 更 简单 一 些 。 


(allocate a new entry 39)= 
p = ALLOC(sizeof (*p) + len + 1); 
p-»len = Jen; 
p-»str = (char *)(p + 1); 
if (Gen > 0) 
memcpy(p->str, str, len); 
p->str[len] = '\0'; 
p->link = buckets[h]; 
buckets[h] = p; 


{includes 34}= 
#include “mem, h” 
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图 3-2 Hash 表 结构 


ALLOC 足 Mem 的 基本 分 配 函 数 ， 它 模拟 标准 库 中 的 丽 数 malloc ， 其 参数 足 请 求 的 字 节 
数 。Atom_new 不 能 使 用 Mem 中 的 NEW 岂 数 (在 Stack_push 中 说 明 过 )， 因 为 其 字 节 的 长 度 
依赖 于 len ， 而 NBW 仪 用 在 字 节 数 在 编 岩 时 就 已 知 的 情况 下 才 可 以 使 用 。 上面 的 ALLOC 调 用 
为 atom 结 构 和 序列 分 配 空 间 ， 序 询 被 立即 在 人 随后 的 字 节 中 。 

传 给 Atom_new 的 序列 的 散 列 操作 包括 计算 代表 序列 的 一 个 无 符号 数 。 理 论 王 ， 对 于 N 
个 序列 ,这些 散 列 值 应 该 均 名 分 布 在 0 到 NELEMS(buckets)-1 之 间 .。 如 果 号 这 样 分 布 的 . 却 
么 buckets 中 的 鲜 一 个 链表 部 有 N/NELEMS(buckets) 个 元 素 ， 且 搜索 一 个 序列 鸭 平 均 时 间 将 
J&N/2 - NELEMS(buckets)。 如 果 NN 小 十 2，NELEMS(buckets) ， 那 么 搜索 时 间接 近 常 

散 询 操作 是 一 个 值得 好 好 研究 的 课题 ， 现 在 也 已 经 有 许多 很 好 的 散 列 函数 . Atom_new 
使 用 一 个 简单 的 查找 表 算 法 : 


(h e hash str (0..1en-1) 39)= 
for (h = 0, i = 0; i < len; ++) 
= (h<<1) + scatter[(unsigned char)str[il]; 
scatter — 256 A LL RAE, ETERA OU DG VLC. JX HEN OLOR E PE BE h BU 56 
Brand ER. KEAR, BOM A ERR RA U T tE pü T ECIRUS A, A str] EW 
HAG SF ERE SEE SOC PL SERR (plaia) FERAE: UL LETT DE APS, 
HDA ATS RU. WORM Ak MIA, AST REI ELER I, (E1127 fist 








38 
39 




















30 RIE 








为 负数 。 


(data 36}= 
static unsigned long scatter[] = { 
2078917053, 143302914, 1027100827, 1953210302, 755753631, 2002600785, 
1405390230, 45248011, 1099951567, 433832350, 2018585307, 438263339, 
813528929, 1703199216, 618906479, 573714703, 766270699. 275680090, 
1510320440, 1583583926, 1723401032, 1965443329, 1098183682, 1636505764, 
980071615, 1011597961, 643279273, 1315461275, 157584038, 1069844923, 
471560540, 89017443, 1213147837, 1498661368, 2042227746, 1968401469, 
1353778505, 1300134328, 2013649480, 306246424, 1733966678, 1884751139, 
744509763, 400011959, 1440466707, 1363416242, 973726663, 59253759, 
1639096332, 336563455, 1642837685, 1215013716, 154523136, 593537720, 
704035832, 1134594751, 1605135681, 1347315106, 302572379, 1762719719, 
269676381, 774132919, 1851737163, 1482824219, 125310639, 1746481261, 
1303742040, 1479089144, 899131941, 1169907872, 1785335569, 485614972, 
907175364, 382361684, 885626931, 200158423, 1745777927, 1859353594, 
259412182, 1237390611, 48433401, 1902249868, 304920680, 202956538, 
348303940, 1008956512, 1337551289, 1953439621, 208787970, 1640123668, 
1568675693, 478464352, 266772940, 1272929208, 1961288571, 392083579, 
871926821, 1117546963, 1871172724, 1771058762, 139971187, 1509024645, 
109190086, 1047146551, 1891386329, 994817018, 1247304975, 1489680608, 
706686964, 1506717157, 579587572, 755120366, 1261483377, 884508252, 
958076904, 1609787317, 1893464764, 148144545, 1415743291, 2102252735, 
1788268214, 836935336, 433233439, 2055041154, 2109864544, 247038362, 
299641085, 834307717, 1364585325, 23330161, 457882831, 1504556512, 
1532354806, 567072918, 404219416, 1276257488, 1561889936, 1651524391, 
618454448, 121093252, 1010757900. 1198042020, 876213618, 124757630, 
2082550272, 1834290522, 1734544947, 1828531389, 1982435068, 1002804590, 
1783300476, 1623219634, 1839739926, 69050267, 1530777140, 1802120822, 
316088629, 1830418225, 488944891, 1680673954, 1853748387, 946827723, 
1037746818, 1238619545, 1513900641, 1441966234, 367393385, 928306929, 
946006977, 985847834, 1049400181, 1956764878, 36406206, 1925613800, 
2081522508, 2118956479, 1612420674, 1668583807, 1800004220, 1447372094, 
523904750, 1435821048, 923108080, 216161028, 1504871315. 306401572, 
2018281851, 1820959944, 2136819798, 359743094, 2354150250, 1843084537, 
1306570817, 244413420, 934220434, 672987810, 1686379655, 1301613820, 
1601294739, 484902984, 139978006, 503211273, 294184214, 176384212, 
281341425, 228223074, 147857043, 1893762099, 1896806882, 1947861263, 
1193650546, 273227984, 1236198663, 2116758626, 489389012, 593586330, 
275676551, 360187215, 267062626, 265012701, 719930310, 1621212876, 
2108097238, 2026501127, 1865626297, 894834024, 552005290, 1404522304, 
48964196, 5816381, 1889425288, 188942202, 509027654, 36125855, 
365326415, 790369079, 264348929, 513183458, 536647531, 13672163, 
313561074, 1730298077, 286900147, 1549759737, 1699573055, 776289160, 
2143346068, 1975249606, 1136476375, 262925046, 92778659, 1856406685, 
1884137923, 53392249, 1735424165, 1602280572 


Atom-length 不 能 对 其 参数 进行 敬 列 操作 ， 央 为 它 不 知道 参数 的 长 度 。 但 是 该 参数 肯 
是 原子 ， 因 此 Atom_length 仅 仪 对 buckets 中 钛 表 的 指针 进行 来 加 的 比较 就 可 以 了 。 如 果 它 


到 了 原子 ， 将 返回 原子 的 长 度 : 
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(functions 35)+= 
int Atom length(const char *str) { 
struct atom *p; 
int i; 


assert(str); 
for (i = 0; i < NELEMS(buckets); i++) 
for (p = buckets[i]; p; p = p-»link) 
if (p-»str == str) 
return p->len; 
assert(0); 
return 0; 


} 
assert(0) 实 现 了 可 检查 的 运行 期 错误 ，Atom. length 必 须 在 参数 为 原子 而 不 是 字符 串 指针 时 调 
用 。assert(0) 也 用 于 标识 发 生 了 不 期 望 发 生 的 情况 ， 即 所 谓 的 “不 可 发 生 ” 的 情况 。 41 


参考 书目 浅 析 


原子 已 在 LISP 语 言 中 使 用 了 很 长 的 时 间 ，LISP 也 是 原子 这 个 和 名字 的 发 源 地 ; 原子 也 一 直 
用 在 字符 处 理 ( string-manipulation ) 语言 中 ， 比 如 SNOBOL4， 这 种 语言 实现 了 与 这 一 章 
(Griswold 1972 ) 中 描述 的 几乎 完全 相同 的 字符 串 。C 编 评 器 Ice (Fraser 和 Hanson 1995 ) 
中 有 一 个 类 似 于 Atom 的 模块 ， 是 Atom 的 实现 的 早期 产品 。 Ice 为 出 现在 源 程 序 中 的 所 有 标识 
符 和 常量 在 一 个 单 一 表 中 存储 一 个 字符 由 ， 并 且 从 不 释放 它们 。 这 样 做 不 会 消耗 太 大 的 存储 
空间 ， 因 为 在 C 程 序 中 , 万 沦 源 程序 有 多 大 ， 不 同 字符 串 的 数量 部 是 相当 少 的 。 

Sedgewick ( 1990 ) 和 Knuth ( 1973b ) 详细 搞 述 了 散 列 ， 并 为 如 何 缩写 一 个 好 的 散 列 画 
数 给 了 些 指导 。Atom ( #llec ) rb RA RK BUE S. E&H Hans Boehm 提 出 的 。 














练习 


3.1 大 多 数 文章 建议 对 buckets 的 大 小 使 用 一 个 素数 。 使 用 素数 和 - -个 好 的 散 列 函数 ， 
通常 能 够 得 到 buckets 中 链表 的 长 度 的 -个 很 好 的 分 布 .Atom 使 用 了 2 BYE, RCH 
做 法 有 时 被 当 作 不 好 的 例子 加 以 引用 ， 编 写 一 个 生成 或 读 取 比 如 说 10 000438 RUS 
符 囊 的 程序 ， 并 测试 Atom_new 的 速度 和 链表 长 度 的 分 布 状况 ， 然后 修改 buckets , 
使 它 具 有 2 039 ( 小 于 2 048 的 最 大 素数 ) PAG, ， 将 语句 
h &= NELEMS(buckets)-1; 
改 为 
h %= NELEMS(buckets) ; 
并 卫 重 复 测试 。 使 用 素数 起 到 作用 了 吗 ? 对 于 你 的 特定 机 器 ， 你 的 结果 是 多 少 ? 
3.2 翻阅 一 些 关于 更 好 的 散 列 两 数 的 文章 ， 例 如 Knuth ( 1973b ) ， 还 有 关于 算法 和 数据 
结构 的 类 似 文章 及 闪 参 考 文献 以 及 关于 编译 器 的 文章 ， 像 Aho 、 Sethi flUllman [2j 
(19860. 试 试 这 些 函 数 ， 并 测试 它们 的 优点 。 
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3,3 
3.4 


3.5 


3.6 


3.7 


3.8 


3.9 


解释 为 什么 Atom_new 不 使 用 标准 C 库 丽 数 strncmp 比较 序列 。 
声明 原子 结构 的 入 一 种 方法 如 下 : 
struct atom { 

struct atom *link; 

int len; 

char str[1]; 
J; 
对 len 宁 节 的 字符 串 ， 我 们 使 用 ALLOC(sizeof*p) + len) f struct atom, iA 
作 将 为 link 和 len 以 及 能 存储 len + 1 个 字 节 的 str 分 配 空间 ， 这 种 方法 避免 了 由 于 将 str 
声明 为 指针 所 问 接 导 敏 的 额外 时 间 和 空间 请 求 、 不 六 的 是 ,这 种 方式 违背 了 C 祭 准 ， 
因为 客户 调用 程序 访问 的 字 节 地 址 越过 了 str[0] ， 且 这 种 访问 的 影响 没 被 说 明 。 实 
现 这 种 方法 ， 并 测试 辣 接 开销 。 为 了 节约 一 点 空间 而 违反 C 标 准 ， 这 值得 吗 ? 
Atom_new 将 struet atom 的 len 字 自问 输 人 序列 的 长 度 做 了 比较 ， 以 避免 比较 不 同 长 
度 的 字符 证 列 。 如 果 每 一 个 原子 的 散 列 值 ( 站 buckets 的 编号 ) 也 存 人 struct atom rh, 
ARG, (ii te wa ABE TT ERE, SEE Up “AE”, ARRE > 这 样 做 值得 吗 ? 
Atom_length 的 运行 时 间 比 较 慌 。 试 修改 Atom 的 实现 以 使 得 Atom_length 的 运行 时 
间 与 Atom_new 的 大 臻 相同。 
因为 Atom 接 口 的 所 数 足 容 户 调用 程序 最 党 用 的 类 函数 ， 所 以 它 发 展 为 现在 的 这 
种 形 蕊 。 本 练习 以 及 随后 的 练习 探讨 的 其 他 果 数 和 设计 也 可 能 很 有 几 。 请 实时 : 
extern void Atom.init(int hint); 
这 里 hint 估 算 了 客户 调用 程序 所 希望 创建 的 原子 个 数 。 你 应 该 添 们 什么 样 的 可 检查 
秀 运 行 期 错误 以 限制 Atom_init 的 调用 时 机 ? 
TUL ARE BOR 88 98. CRA Atom fv Rik D s S DE 0. DUM. dd 


extern void Atom free (char *str); 
extern void Atom reset(void); 


BEC SH ARCH str ÁR E MRF. SOLS BENE. HI 了 说 明和 实现 相 
应 的 可 检查 运行 期 错误 。 
有 些 客户 调用 程序 希望 在 运行 开始 时 就 装 入 - 些 字 符 串 作为 原子 供 以 后 使 用 。 请 实现 ， 


extern void Atom vload(const char *str, ...); 
extern void Atom aload(const char *strs{]); 


Atom_vyload 装 人 了 可 变数 日 的 参数 列表 中 给 出 的 所 有 字符 串 ， 直 到 碰 到 RAS 
Sti Atom_aload 对 以 空 字 符 为 结果 符 的 字符 串 指 针 数 组 实现 了 同样 的 功能 。 

如 果 客 户 调用 程序 保证 不 释放 字符 趾 NEZ Gon EDU HIIS UE PERS. OMEN RE 
来 说 非常 普遍 。 请 实现 : 

extern const char *Atom_add(const char *str, int len); 

它 的 功能 类 似 于 Atoem_new ， 但 没有 拷贝 字符 序列 、 如果 你 提供 了 Atom_add 和 
Atom_free (以 及 练习 3.8 中 的 Atom. reset )， 却 么 还 需要 说 明和 实现 哪些 可 检查 的 
运行 时 错误 ? 








第 4 章 ”异常 与 断言 


程序 中 通常 会 出 现 三 种 错误 : 用 户 错 误 、 运行 期 错误 以 及 异常 ， 用 户 错误 是 在 预料 中 的 ， 
因为 它们 可 能 是 因为 用 户 不 正 饥 的 输入 引起 的 。 命 名 一 个 并 不 存在 的 文件 ， 或 是 在 电子 表格 
中 输入 非 正规 的 数据 ， 或 是 提交 给 编译 器 的 源 程 序 木 号 就 有 语法 错 音 ， 等 等 ， 都 属于 用 户 错 
误 。 程 序 必 须 计划 并 处 理 这 类 错 认 。 通 常 ， 函 数 必须 处 理 用 户 错误 并 返回 错误 代码 ， 这 些 错 
误 是 计算 过 程 中 很 正常 的 一 部 分 - 

在 前 面 章节 中 提 到 的 可 检查 的 运行 期 错误 是 对 - -种 类 型 错误 。 它 们 不 是 用 户 错误 。 根本 
不 在 预料 中 ， 并 旦 总 是 揭示 了 程序 的 漏洞 。 因 此 ， 考 到 这 类 错误 ,应 用 程序 将 无 法 恢复 ; 但 
它们 必须 要 合理 地 结束 。 林 书 中 的 实现 使 用 断言 来 捕获 这 类 错误， 断言 的 处 理 将 在 4.3 节 中 
给 出 。 断 这 总 是 会 导 笋 程序 终 上 小 ,终止 的 方式 可 能 出 机 器 或 是 应 用 程序 次 定 。 

莉 常 是 介 十 用 户 错误 和 程序 销 误 之 间 的 一 类 错误 .异常 总 很 少 出 现 呈 可 能 不 可 预 浏 的 错 
KR, 但 是 从 异常 中 恢复 是 可 能 的 。 某 些 异 常 反 应 了 机 器 的 作 能 ， 例 如 算术 洪 出 、 下 浇 和 栈 的 
Wk 等 等 。 其 他 异常 显 和 了 操作 系统 所 检测 的 状态 ， 这 些 状态 也 可 以 出 用 户 来 初始 化 ， 例 如 
点 击 了 “中 断 ” 键 或 写 文件 时 发 生气 错误 等 ， 都 属于 这 类 错误 。 这 类 异常 通常 帆 UNIX 系 统 
的 信号 给 出 ， 并 由 信号 处 理 器 进行 处 理 ， 当 有 限 的 资源 耗 尽 时 也 会 发 生 异 常 ， 袜 如 当 应 用 程 
序 用 尽 了 内 存 战 是 指定 的 电子 表格 太 大 等 等 。 

异常 并 不 会 经 常 发 生 ， 内 此 可 能 会 发 生 异 常 的 半数 通常 不 会 返回 鱼 误 代 瓜 ; 这 样 在 少数 
情况 下 会 造成 代码 的 混乱 ， 而 多 数 情况 下 会 给 程序 带 米 不 确定 性 。 如果 应 用 程序 放生 的 异常 
EMT Pk SAS, IBAA MUR Ser. HER CAE, EO IRR LE oA. "OR 
ERTS AAS AN OR, nba ROE SCIL FCU ETUR TOR iy ABRE, AR dL BUE SE yy Sb qe P: 
BUR AE MBM goto iH A], USE LIM, ARSE RT LATE vens AUR SEAR TB BEEP SDA a 

某 些 程序 设计 语言 嵌入 了 实例 化 处 理 程序 和 产生 异常 的 工具 。 在 Ch ， 标 准 库 函 数 
setjmp 和 longjmp 形 成 了 结构 化 异常 工具 的 某 础 。 简 单 地 说 即 setjmp 实 例 化 处 理 程序 ， 而 
longjmp 产 生 异 常 ， 

下 而 用 一 个 例子 进行 详细 说 明 。 设 函数 aliocate 调用 malloc 来 分 陋 4 个 字 节 ,并 返回 个 
由 malloc 返 加 的 指针 。 然而 如 果 malloc 返 坷 的 是 空 指针 ， 这 说 明 所 浓 求 的 空间 不 能 分 配 ， 那 
Aallocate SE $195 HA llocated_FailedS+ ©. 这 个 异常 木 身 在 标准 头 文件 setjmp.h 中 被 声明 为 
jmp buf; 








#include «setjmp.h» 


int Allocation handled = 0; 
jmp.buf Allocate Failed; 
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除非 实例 化 了 某 个 处 理 程序 ， 否 则 Allocation_handied 为 0， 且 allocatc 在 地 出 异常 之 前 会 先 检 
查 Allocation_handled: 


void *allocate(unsigned n) { 
void *new = malloc(n); 


if (new) 
return new; 
if (Allocation handled) 
longjmp(Allocate Failed, 1); 
assert(0); 
} 
在 分 配 失败 而 义 没有 实例 化 任何 处 理 程 序 的 时 候 ，allocate 用 了 一 个 断言 实现 了 可 检查 的 运 
行 期 错误 。 
处 理 程序 是 调用 setjmp(Allocate_Failed) 来 实例 化 的 ， 沪 调用 会 返回 一 个 整数 ，setjmp 最 
令 人 感 兴趣 的 特征 是 它 可 以 返回 两 次 。 调 用 setjmp 时 返回 9， 而 在 allocate 中 调用 longjmp 会 引 
起 第 一 次 值 的 返回 ， 该 值 由 longjmp 的 第 二 个 参数 给 出 ， 这 在 上 面 的 例子 中 就 在 在 。 因 此 ， 
客户 调用 程序 就 可 以 通过 测试 setjmp 的 返回 值 来 处 理 异 常 : 
char *buf; 
Allocation_handled = 1; 
if (setjmp(Allocate Failed)) í 
fprintf(stderr, "couldn't allocate the buffer\n"); 
exit (EXIT_FAILURE) ; 
} 


buf = allocate(4096); 
Allocation_handled = 0; 


当 setjmp 返 回 0 时 ， 继 续 调用 allocate 。 如 果 分 配 拓 败 ，aliocate 中 的 iongjmp 引 起 sctjmp 再 
一 次 返回 ， 这 次 返回 值 为 ， 央 此 ， 继 续 调 用 fprint 和 exit， 

这 个 例子 并 没有 处 理 谋 套 的 程序 ， 如 果 上 面 的 代码 测 用 晴 数 makebuffer， 就 有 可 能 出 现 
旋 套 的 处 理 程序 ， 因 为 makebuffer 本 身 就 实例 化 个 处 理 程 序 并 日 调用 了 allocate 。 租 套 处 
理 程 序 是 必须 提供 的 ， 因 为 客户 调 昨 程序 可 能 不 知道 实现 出 于 自己 的 日 的 也 实例 化 了 某 个 处 
理 称 序 。 而 芒 Allocation_handled 标 志 的 使 用 也 很 麻烦 ， 如 果 不 在 惟 当 的 时 候 对 它 进行 设置 
和 清除 就 会 引起 混乱 。 在 下 一 节 中 给 出 的 Except 接 口 将 处 理 这 些 装 题 。 


41 接口 


Except 接 口 作 一 系列 宏 指令 和 函数 中 包装 fsetjmpylongjmp ， 它 们 -… 起 提供 了 一 个 结构 
化 的 异常 处 理工 具 ， 这 个 工具 并 不 很 完美 , 但 是 它 辟 免 了 上面 列 出 的 错误 ， 而 使 用 异常 的 地 
方 也 用 宏 指 令 清 楚 地 加 以 标识 ， 

异常 是 Except TXH H -AER RSE k: 
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(except. W= 
#ifndef EXCEPT_INCLUDED 
#define EXCEPT. INCLUDED 
#include «setjmp.h» 


#define T Except T 
typedef struct T ( 

Char *reason; 
T 


(exported types 53) 
(exported variables 53) 
(exported functions 48) 
(exported macros 48) 


#undef T 
#endif 
Except-T 结 构 只 有 - ' 个 字段 ， 它 可 以 初始 化 为 一 个 描述 异常 的 字符 串 。 当 发 生 一 个 未 处 理 的 
异常 时 ， 才 会 把 该 字符 串 打印 出 来 。 
蜡 常 处 理 程序 处 理 的 是 异常 的 地 由 。 蜡 常 必 须 是 全 局 的 或 静态 的 党 最 ， 因 此 它们 的 地 址 
JE -地 标识 了 它们 。 如 果 把 异常 声明 成 -个 局 部 变量 成 参数 就 会 产后 木 可 检查 的 运行 期 错误 。 
异常 e HRAISE 宏 指令 引发 或 出 函数 Except_raise 引 发 : 


(exported macros 48)= 
#define RAISE(e) Except_raise(&(e), FILE, . LINE ) 


(exported functions 48)= 
void Except raise(const T *e, const char *file,int line); 
将 空 的 e 传 给 Except_raise 是 可 检查 的 运行 期 错误 。 

处 理 程序 是 出 TRY-EXCEPT 和 TRY-FINALLY 语 名 来 实例 化 的 ， 这 两 个 语句 用 宏 指 令 实 
现 。 这 两 个 语句 可 以 处 理 嵌 矢 异 常 ， 也 可 以 管理 异常 状态 的 数据 。TRY-EXCEPT 语 句 的 语 
法 是 : 

TRY 


s 
EXCEPTCe, ) 


Sı 
EXCEPT Cez) 
$5; 
EXCEPT(e, ) 
, 

ELSE 
So 
END_TRY 


TRY-EXCEPT 语 句 命名 为 el，ex, …， en。， 的 异常 创建 了 处 理 程序 ， 并 执行 语句 S$。 如 果 $ 没 有 
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dE RA. HERR ER. AZEBRRATTEND TRYZÉUG MIR j. WORSE Rive, Be he, 
He Zid H— +. MASHER CHBE UBL. Peri pa HL EXCEPT A h] cni), BAG 
拆除 处 理 程序 ,执行 EXCEPT 从 句 中 的 处 理 诸多 8 、， 然 线 执 行 END_TRY 之 后 的 语句 ， 

如 果 $ 产 生 了 了 -~- 个 不 在 el 到 en 之 辣 的 异常 ， 那 么 将 终止 处 理 程 序 ， 抉 行 ELSE 之 后 的 语句 ， 
然后 继续 执行 END_TRY 之 后 的 语句。ELSE 从 人 蚀 吓 可 选 的 。 

如 果 $ 产 生子 -一 个 不 由 任何 9 处 理 的 异常 ， 那 么 终止 处 理 程序 ， 且 将 异常 传递 给 前 - .个 执 
行 TRY-EXCRPT 或 TRY-FINALLY 浅 句 所 创建 的 处 至 程序 。 

TRY-END-TRY 在 句法 上 等 价 于 一 条 语句 : TRY 怀 点 一 个 新 的 作用 域 ， 该 作用 域 在 下 一 
个 EXCEPT ELSE, FINALLY &END. TRY &tEá R. 

为 了 说 明 这 些 宏 指 令 的 使 用 ,我 们 把 前 “ 节 结 束 时 的 例子 改写 一 下 。 把 Allocate_Failed 
变 成 一 个 异常 ， 该 异常 是 在 malloc 返 同一 个 裤 指 针 时 由 allocate 引 发 : 









Except T Allocate Failed = { "Allocation failed" }; 


void *allocate(unsigned n) { 
void *new = malloc(n); 


if (new) 
return new; 
RAISE (Al locate_Fai led); 


assert(0); 


} 
如 果 客 户 调用 程序 代码 想 处 理 这 个 并 常 ， 部 么 它 需要 在 TRY-EXCEPT 语 何 内 调用 allocate: 


extern Except_T Allocate_Failed; 

char *buf; 

TRY 
buf = allocate(4096); 

EXCEPT(Allocate Failed) 
fprintf(stderr, "couldn't allocate the buffer\n”); 
eXit(EXIT. FAILURE) ; 

END TRY; 


TRY-EXCEPT i) &:isetimp#llongimp K X FLAY , FAL fase C (048 Fic e edi 003 dk 
TRY-EXCEPT Pil RaW. WHE, SASDUE SRP ARAN, RR ARE 
执行 某 个 处 理 程序 语句 8; 或 继续 执行 END_TRY 之 后 的 语句 时 ， 孝 么 这 种 改变 就 不 在 在 了 。 
例如 ， 程 序 片段 ， 


static Except_T e; 
int i = O; 
TRY 

dei 

RAISECe) ; 
EXCEPT (e) 
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END. TRY; 
printf("%d\n", i); 


可 以 打印 出 0 或 1， 这 决定 于 setjmp 和 longjmp 的 实现 细节 : FEST BCE 05 A E o A TRO 
volatile; fj fy, RU WO BD K SN 
volatile int i = 0; 
那么 上 面 给 出 的 例子 将 会 打印 出 1 - 
TRY-FINALLY 语 名 的 语法 是 : 
TRY 
S 
FINALLY 
5, 
END. TRY 
MURS IAP EELS, MARITS, BUSHEPUGEND TRY 之 后 的 语句 。 如 时 5 产生 了 
异常 ， 那 么 8 的 涩 行 被 中 断 ， 控 制 立即 转 给 $51。51 执 行 完 后 ， 引 起 $1 执行 的 异常 重新 产生 ， 使 
得 它 可 以 由 前 一 个 实例 化 的 处 理 程序 来 处 理 ， 注 意 5, 是 在 两 种 情况 中 部 必须 执行 的 。 处 理 程 
序 可 以 用 REBRAISE 宏 指令 显 式 地 重新 产生 错 常 : 
(exported macros 48yr= 


#define RERAISE Except raise(Except frame. exception, \ 
Except frame,file, Except frame.line) 


TRY-FINALLY 语 句 等 价 于 : 


TRY 


注意 : RE RATA CR, SEER. 


我 们 使 用 TRY-FINALLY 语 名 的 日 的 是 给 客户 油 几 得 序 SEL. AERE ORE AHER 
“清理 ”现场 。 例 如 ， 
FILE *fp = fopenc...); 
char *buf; 
TRY 
buf = allocate(4096); 
FINALLY 
fclose(fp); 
END TRY; 


FEDERI Se CAR BE STAT T ERU SPR. MRAR, OU HI atas ga yE 
来 处 理 Allocate_Failed 。 
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如 果 TRY-FINALLY 语 句 中 的 $; 或 是 TRY-EXCEPT 语 名 中 的 处 理 程 序 产 生 SR. ABA 
该 异常 也 是 由 前 面 实例 化 的 处 理 程序 来 处 理 
简化 语句 : 


TRY 
s 
END_TRY 


F P: 


TRY 
M 
FINALLY 


END TRY 
接口 中 的 最 后 一 个 宏 指 令 是 

{exported macros 48)+= 

#define RETURN switch (pop 56),0) default: return 

RETURN 宏 指令 用 在 TRY 语句 内 部 ， 用 来 替代 return 语 句 。 在 TRY-EXCEPT 或 TRY- 
FINALLY 语 名 内 部 执行 C 的 return 语 名 足 一 个 不 可 检查 的 运行 期 错误 。 如 果 TRY-EXCEPT 或 
TRY-FINALLY 中 的 语句 必须 朗 执 行 return ,那么 它们 用 这 个 宏 指 令 代 过 通常 CIreturn 语 句 。 
在 这 个 宏 指令 中 还 使 用 switch 诸 句 ， 它 可 以 将 RETURN RETURN et sts E idi 
的 C 语 名 。<pop 56> 的 细节 将 在 下 一 节 中 给 出 。 

了 xcept 接 口中 的 宏 指 令 被 公认 为 是 很 粗 上 的 ， 甚 至 有 些 脆弱 。 接 门 中 不 可 检查 的 运行 期 错 
误 特 别 麻烦 ， 很 难 发 现 。 但 它们 对 大 和 多数 应 用 来 说 都 已 经 足够， 大 为 异常 应 该 尽 基 地 少 用 ， 
一 般 只 在 大 型 应 用 程序 中 少量 使 用 。 如 果 异 常 越 来 械 多 ， 这 通常 说 明 程序 有 更 严重 的 设计 错误。 


4.2 实现 


Except 接 口中 的 宏 指令 和 函数 一 起 维护 了 一 个 记录 异常 状态 以 及 实例 化 处 理 程序 结构 的 
堆 校 。 结 构 中 的 字段 eny 就 足 setjmp 和 longjmp 使 用 的 某 个 jmp_buf， 内 此 这 个 维 栈 可 以 处 理 
REMH 


(exported types 53)= 
typedef struct Except_Frame Except_Frame; 
struct Except Frame { 
Except_Frame *prev; 
jmp buf env; 
const char *file; 
int line; 
Const T *exception; 
E 


(exported variables 53)= 
extern Except Frame *Except stack; 
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Except stack# MARNE, ST MU prevr RRA EMO. RRB TP 
RERAISE E XAUIB EE, E -个 异常 就 足 将 吴 常 的 地 此 在 在 exception 字 段 中 ， 并 分 别 在 file 
和 line 字 段 中 保存 异常 的 附属 信息 一 一 噶 常 产 生 的 文件 以 及 行 号 - 

TRY 从 名 将 -A Except Frame EA 83$ #2, JF /Hsetjmp. Hi RAISE 和 RERAISE 调 
用 Except_raise 填 充 栈 丙 帧 的 字段 exception 、file 和 line， 从 异常 栈 中 弹出 栈 顶 Except_Frame , 
然后 调用 longjmp 。EXCEPT 从 句 检 查 该 帧 中 的 exception 字 段 ， 决 定 应 该 用 哪个 处 理 程序 。 
FINALLY 从 气 执 行 清除 代码 ， 并 重新 产生 已 弹出 的 异常 帧 中 存储 的 异常 。 

如 果 发 生 了 异常 却 没有 执行 处 埋 控 制 就 达 刘 END TRY A], VE EN BER SEE, 

宏 指 令 TRY、EXCEPT 、 ELSE, FINALLY 和 END_TRY -起 将 TRY-EXCEPT 语 名 转化 
成 如 下 形式 的 语句 


do { 
create and push an Except_Frame 





if (first return from setjmp) í 


5 

} else if (exceptionis el ) í 
5 

P else if (exceptionis e,) { 
Sn 

} else { 
So 

if (an exception occurred and wasn’t handled) 
RERAISE; 

} while (0) 


do-whileis ft (&TRY-EXCEPT iB E18 3.1. 94 FCN IB A], AEE PLUR EE I HC is 
名 一 样 使 用 。 例如， 它 也 可 以 用 作 让 诗句 的 结 录 诗句 ， 图 4-] 显示 的 足 常 规 TRY-EXCEPT 语 
名 产生 的 代码 ， 带 阴影 的 代码 块 帘 出 显 未 了 扩展 FRY 和 ENP_TRY 宏 指令 所 产生 的 代码 ， 单 
线条 相 围 住 的 代码 块 是 EXCEPT 宏 指令 的 代码 ， 而 双 线条 框 围 住 的 代 但 块 旦 ELSE 宏 指令 的 
代码 。 图 4-2 显 示 的 是 扩展 TRY-FINALLY 活 句 ， 单 线条 低 围 住 的 代码 块 是 FINALLY 宏 指 令 
的 代码 . 
Except_Frame 的 空间 分 配 很 简单 ， 在 出 TRY 开始 的 do-while 主 休 中 的 复合 语句 内 部 声明 
一 个 该 类 曹 的 局 部 变 基 即 可 : 
(exported macros 48)+= 
#define TRY do { \ 
volatile int Except flag; Ñ 
Except.Frame Except frame; X 
(push se) N 


Except flag = setjmp(Except frame.env); X 
if (Except flag == Except entered) { 
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AETRY iB) M RRA, HT AAI BOE RET 26 h 


(exported types 53)+= 
enum í Except_entered=0, Except raised, 
Except. handled, Except finalized J; 


setjmp 49 $ — Pik E fii FsExcepi-flag i $8 JjExcept entered, jo ATRYiS S, Hf prs 
个 异常 帧 扑 人 异常 栈 . EXcept_entered 必 须 为 0 ， 央 为 setjmp 首 次 沽 用 的 返回 值 为 0， 随 后 ， 
setjmp 的 返回 值 将 被 设 为 Except_raised ， 表 相 发 生 了 异常 ， 处 理 程 主将 Except_flag 的 值 设 成 
Except_handled ， 表 未 处 理 秋 序 已 经 村 独 党 进行 了 了 处理 


do í 
volatile int Except. flag; 
Except Frame Except frame; 
Except frame.prev = Except stack; 
Except.stack = &Except..frame; 
Except flag = setjmp(Except frame.env); 
if (Except flag == Except entered) Í 
5 
if (Except_flag == Except_entered) 
Except_stack = Except_stack->prev; 
} else if (Except. frame.exception == &(e,)) { 
Except_flag = Except_handled; 
5 
if (Except flag == Except entered) 
Except. stack = Except. stack-»prev; 
} else if (Except frame.exception == &(e5)) Í 
Except fjag = Except. handTed; 
52 
if (Except flag == Except entered) 
Except stack = Except. stack-»prev; 














H else if (Except frame.exception == &(e,)) 1| 
Except flag - Except handled; 
$ 


if (Except_flag == Except_entered) 
Except_stack = Except_stack->prev; 
} else { 
Except_flag = Except_handled; 
So 
if (Except flag == Except entered) 
Except_stack = Except stack-»prev; 





n 


























H 
if (Except flag == Except. raised) 
Except. raise(Except. frame. exception, 
Except frame.file, Except frame.line); 
3 while (0 


|E4-i TRY-EXCEPT if nj JE 
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do { 
volatile int Except, flag; 
Except.Frame Except frame; 
Except.frame.prev = Except Stack; 
Except.stack = &Except frame; 
Except flag = setjmp(Except. frame.env); 
if (Except flag == Except entered) { 

S 





if (Except flag == Except entered) 
Except stack = Except stack-»prev; 
tf 


if (Except flag == Except entered) 
Except. flag = Except. finalized; 








Sy 
af (Except, flag == Except entered) 
£xcept stack = Except_stack->prev; 


H 
if (Except flag == Éxcept raised) 
Except raise(Except frame.exception, 
Except frame,file, Except_frame. Tine); 
Y while (0) 


网 4-2 TRY-FINALLY 语句 的 扩展 


Fxcept_Frame 的 大 贱 损 作 足 将 它 盾 入 到 Except_stack 指 向 的 Except_Frame 结 构 链表 的 表 
X. HRQ IOUT RAE 是 将 它 从 链表 下 移出 : 


(push 56)= 
Except frame.prev = Except stack; V 
Except stack = &Except frame; 


(pop ss)- 
Except stack = Except. stack-»prev 
EXCEPT JA f; "lE Wi, ( QA 4-1 Bias iljelsc-ifift h), 


{exported macros 48)+= 
fdefine EXCEPT(e) X 


(pop if this chunk follows S 57) N 
} else if (Except. frame.exception == &(e)) ( Ñ 
Except flag = Except handled; 


(pop if this chunk follows S 57)= 
if (Except flag == Except entered) (pop 56); 


THER b FUSE E Ze des HE SC 4. EAR <pop if this chunk follows S 57» fNAS IRAR 
BOO ARCU h g AD 上述 EXCEPT 定 义 中 的 else- 让 诸 句 之 前 . 而且 仪 仪 只 在 第 -~ 个 EXCEPT 
M] por ye A ERU BR DUC an Acus SUN EPA RER , Except. flag EH 
然 为 ExceptL entered, ROKA WANANE ht Rer Holt cid ole ORE TOUS 
EXCEPT M hj (Except, flag & X Except handled fy 2b JEU 2 Bar. AY Br RIER ER ， 
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异常 栈 已 经 进行 了 出 栈 操作 ， 并 且 <pop if this chunk follows S 572 a if HEF) RUT A BRE 


ELSE 从 名和 EXCEPT 从 名 类 似 , 但 是 else-f 只 是 -Pelse ; 


(exported macros 48)+= 
#define ELSE \ 
(pop if this chunk follows S 57) Ñ 
} else (N 
Except. flag = Except handled; 


F, ，FINALLY 与 ELSE 类 似 ， 但 是 没有 else 诸 多 : 


(exported macros 48) 
#define FINALLY \ 
(pop if this chunk follows S 57) N 
JOAN 
if (Except_flag == Except_entered) \ 
Except_flag = Except_finalized; 


ERE, Except flag Except entered/E?g Except finalized, WM IFMAR LAM, (LEA 
SLT FINALLY MA}, In RUE AE SHH, Except_flagh 44845 29Except_raised, i ETE 
行 完 清除 代码 后 ， 可 以 重新 引发 异常 ,该 异常 可 通过 检测 在 扩展 END_TRY 中 Except_flag 标 
志 的 值 是 否 等 于 Except_raised 来 触发 ， 如 果 没 有 发 洁 异 常 ， 邮 么 Except._flag 的 值 将 会 是 
Except_entered 或 Except_finalized ; 


(exported macros 48)+= 
#define END_TRY \ 
(pop if this chunk follows S 57) N 
} if (Except flag == Except raised) RERAISE; Ñ 
} while (0) 


exceptc 中 Except_raise 的 实现 是 最 后 - .个 难点 ; 


(except.o= 
#include <stdlib.h> 
#include <stdio.h> 
#include "assert.h" 
#include "except.h" 
#define T Except_T 


Except_Frame *Except_stack = NULL; 


void Except_raise(const T *e, const char *file, 
int line) { 
Except Frame *p = Except stack; 


assert(e); 
if (p == NULL) { 

(announce an uncaught exception 59) 
H 


p->exception = e; 
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p->file = file; 
p->line = line; 
(pop 56); 


longjmp(p->env, Except_raised) ; 
H 
如 果 在 异常 栈 的 栈 DUI: - Except Frame, #8 AExcept raise! ‘YF Etexception , file Ll Ak 
line， 并 将 异常 栈 的 栈 顶 元 素 阐 出 ， 然 后 调用 longjmp 。 相 应 的 setjmp 调用 将 返 
Except raised; 在 TRY-EXCEPT 或 TRY-FINALLY 语句 中 ， Except_flag 的 值 变 为 
Except raised, ， 并 执行 相应 的 处 理 程序 ， Except_raise 对 异常 栈 进行 出 栈 操作 ， 这 祥 ， 如 果 
某 个 处 理 程序 中 发 生 了 异常 ， 沪 异常 证实 出 TRY-EXCEPT 语 句 米 处 理 ， 央 为 该 异常 的 帧 现 
在 已 经 在 异常 栈 的 栈 顶 了 。 
如 果 异 常 栈 为 说 那么 就 不 存在 处 埋 程 座 ， 央 此 Except_raise 只 能 占 明 蜡 常 为 未 处 理 的 
异常 并 终 小 程序 : 
(announce an uncaught exception 59)= 
fprintf(stderr, "Uncaught exception"); 
if (e->reason) 
fprintf(stderr, " Xs", e->reason); 
else 
fprintf(stderr, " at OxXp", e); 
if (file && line » 0) 
fprintf(stderr, " raised at %s:Xd\n", file, line); 
fprintf(stderr, “aborting...\n"); 


fflush(stderr); 
abort(); 


abort E — THR HEC MRM, “WE kia AT. ANID SOUT SULA KAU BRE, lan, ET 
能 打开 一 个 调试 程序 或 仅仅 进行 内 存 的 转 储 找 贝 ， 


4.3 断言 


般 标 准 娄 求 头 文件 assert.h 把 asserl(e) 定 义 成 -个 提供 诊断 信息 的 宏 指令 。assert(e) je 
求 值 ， 如 果 e 为 0， 那 么 在 标准 错误 上 写 上 诊断 信息 并 调用 标准 库 函数 abort 中 断 执行 。 诊 断 信 
息 包 括 失 败 的 汤 言 (e 的 内 容 ) 以 及 assert(e) 出 现 的 位 置 (文件 以 及 行 导 )。 信息 的 格式 由 具 
体 实现 定义 。 用 assert(0) 标 识 “ 不 可 能 发 和 ”的 状态 就 号 -种 很 好 的 方法 ， 其 他 喜 示 断言 的 
方法 ， 像 : 

assert(!"ptr==NULL -- can't happen") 
可 以 显示 更 多 有 意义 的 诊断 信息 。 

assert. 也 使 用 了 宏 指 令 NDEBUG， 但 是 没有 对 它 进 行 定义 、 如 果 定 义 了 NDEBUG、 IK 
Aassert(e) —jg 975 Rik & (( void ) 0 ) 等 价 。 FUL RUE AA] UIS SER XNDEBUG, ， 并 重新 
BARGE F, eR GE IAT, I CUORE ETMA EERTE, S RRR 
TEREFE, IX ARE BE, 
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assert(e) i— PRIA, ALAS BUS assert hii F MBS Ht T: 


#undef assert 

#ifdef NDEBUG 

#define assert(e) ((void)0) 

#else 

extern void assert(int e); 

#define assert(e) ((void)(C 11 X 
(fprintf(stderr, "%s:%d: Assertion failed: %s\n", N 
—FILE_, (int). LINE |, 4e), abortQ, 0))) 

#endif 


《实际 的 asserth 通 常 与 这 个 不 一 样 ， 因 为 实际 情况 并 不 允许 为 了 使 用 fprintft 和 stderr 而 包含 
Stdio.h )。 类 似 于 ellez 的 表达 式 经 常 出 现在 条 件 语 境 中 ， 例 如 让 和 语句， 但 是 它 也 可 以 作为 单独 
的 语句 出 现 。 当 它 单独 出 现 的 时 仿效 果 等 价 十 语句 : 
if (1(e,)) e; 
assert 的 定义 使 用 了 语句 ellle; Xx RIA 为 assert(e) 必 须 扩 展 成 一 个 表达 式 ， 而 不 是 — 4 BAD. 
Ez 是 一 个 去 苇 表达 式 ， 它 的 返回 结果 是 个 值 ， 这 是 1 操 件 符 的 要 求 ， 商 整个 表达 式 最 后 的 
值 是 帘 ， 基 为 标准 规定 assert(e}) 是 没有 返 区 传 的。 在 标准 的 C 预 处 理 嚣 中 ， 习 悍 用 法 赤 将 产 
生 一 个 字符 中 ， 它 的 内 容 嘴 e 表 达 式 内 容 中 的 字符 。 
入 ssert 接 口 定义 的 assert(e) 与 标准 中 定义 的 类 似 ， 不同 的 是 断言 失败 将 触发 一 个 
Assert_Failed 异 党 .而 不 是 终止 运行 ， 并 且 不 提供 断言 e 的 内 容 : 
(assert.hy= 
#undef assert 
#ifdef NDEBUG 
#define assert(e) ((void)0) 
#else 
#include "except.h" 


extern void assert(int e); 


#define assert(e) ((void) (Ce) | | (RAISE (Assert_Fai led) ,0))) 
#endif 


(exported variables 53) 
extern const Except T Assert Failed; 


Assert (r1 ME P BU E XC, [IS GAP “Massert.h X cff af 3e PE Bb AB JUI, ERRENA E 
except.h 中 会 出 现 Assert_ Faiied 的 原因 -这 个 结构 的 实现 很 简单 ; 
(assert.o= 
#include "assert.h" 


const Except_T Assert_Failed = { "Assertion failed” }; 


void (assert)Cint e) { 
assert(e); 
1 
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BBE X Passer Wie WA SA kT 3238 assert B^ RE, IAEF DETI VARE BR BOR HO RR E 
XB Bs 
如 果 客 户 调用 程序 不 处 理 Assert_Failed ， 姥 么 断言 失败 会 引起 程序 的 中 断 ， 并 给 出 如 下 
息 : 
Uncaught exception Assertion failed raised at stmt.c:201 
aborting... 
该 信息 在 功能 上 等 价 于 针对 具体 机 器 版 本 的 assert.h 中 的 诊断 丰 
把 断言 打包 ， 使 得 当 它 们 失败 时 会 引发 异常 ， 这 有 助 二 处 理 产 品 程序 中 出 现 了 断言 的 情 
况 。- - 些 黎 序 员 建议 不 拒 肠 注 留 在 产 曲 程序 中 ， 并 通过 assert.h 中 使 用 DEBUG 的 标准 来 支 
持 这 个 建议 。 不 把 断言 留 在 产品 中 最 常用 的 两 个 理 出 就 是 有 效 性 和 隐藏 诊断 信息 的 可 能 性 ， 
执行 断言 需要 一 定 的 时 间 ， 内 此 把 断言 移出 可 以 使 程序 BE. Ail. AB aA 


fi 


nil 











B Pf ue Fede DUET NER] F 0925 METERA, ik ENE n9. JY CE NW 
BR. ARIA Y uS FRED RUE EEG WR RE, Bob ERER T TOR ER, 

SER GRAM IMIR TERRE, ATHY YR pit Pit AMMA. EUR AE 
OMAR. PM, (uuth uc THE PIV AAT ED OEY INT, TTP Allg sis Hh. FLEE CS RA 
部 分 的 时 间 化 费 在 8 对 A 的 出 用 上 ， 央 为 8 对 # 的 调用 足 在 循环 内 进行 的 。 经 过 仔细 地 分 析 后 , 
你 会 发 现 p 中 断言 既 可 以 移 到 f ， 也 可 以 移 到 8 中 ， 并 放 在 8 的 循环 之 前 。 

关于 断 埋 的 一 个 更 严重 的 问题 症 ， 它们 可 能 会 引发 像 前 面 提 到 的 断言 失败 之 类 的 诊断 信 
息 ， 这 人 样 会 迷惑 客户 调用 程序 . (AERE BU T, BAUX Ewe TRE B| RE ACUTE 
ER PTT A MUN, IA BAP BL FY RE Re CRAN RT ， 而 且 
WA THE SAAR. 250 

General protection fault at 3F60:40EA 
或 是 

Segmentation fault -- core dumped 
HE 8.3 Ax KAMAN ER RR TS AU RS, EADIE. Ce g RED ERE 
ARE PEE AY A AMG m X BY, RE ET RR. DI. 483867 
能 会 破坏 用 户 的 文件 ， 而 这 种 破坏 是 尤 法 弥补 的 ， 

区 隐 藏 断 霹 失 败 的 诊断 信息 所 带 来 的 问题 ， 可 以 用 穆 序 的 产品 版 本 中 最 外 
语句 来 处 理 ， 该 程序 可 以 找到 所 有 的 末 处 理 的 外 常 ， 并 给 出 更 有 攻 助 的 诊断 信息 















:的 TRY-EXCEPT 
例如: 


#include <stdlib.h> 
#include <stdio.h> 
#include "except.h" 


int main(int argc, char *argv[]) { 
TRY 
edit(argc, argv); 
ELSE 
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fprintf(stderr, 
"An internal error has occurred from which there is " 
"no recovery.\nPlease report this error to " 
"Technical Support at 800-777-1234.\nNote the " 
"following message, which will help our support " 
“staff\nfind the cause of this error.\n\n") 

RERAISE; 
END. TRY; 
return EXIT. SUCCESS; 

} 


当 发 生 了 -个 未 处 理 的 异常 时 ， 这 个 处 理 程序 在 隐藏 诊断 信息 之 前 先 给 出 了 报告 错误 的 
指令 。 例 如 ， 如 果 出 现 了 断言 失败 的 话 ， 它 将 会 打 引 出 : 


An internal error has occurred from which there is no recovery. 
Please report this error to Technical Support at 800-777-1234. 
Note the following message, which will help our support staff 

find the cause of this error. 


Uncaught exception Assertion failed raised at stmt.c:201 
aborting... 


参考 书目 浅 析 


好 几 种 程序 设计 语言 部 嵌入 了 异常 处 理 机 制 ， 例如 Ada 、Modula-3(Nelson 1991)、 
Eiffel(Meyer 1992) 以 及 C++(Ellis 和 Stroustrop 1990) 。Bxcept 接 口 中 的 TRY-EXCEPT 渚 句 就 
是 模仿 的 Modula-3 小 的 TRY-EXCEPT 语 句 。 

CHA HEH 『 几 种 异常 处 理 机 制 ， 它 们 都 提供 了 类 似 TRY-EXCEPT 语 和 的 功能 ， 有 时 在 
语法 和 语义 上 有 些 改 变 。Roberts(1989) 描 述 了 -个 异常 处 理 功能 的 接 门 ， 它 与 Except 接 口 提 
供 的 功能 相同 。 它 的 实现 足 类 似 的 ， 但 是 在 发 二 异常 时 ， 它 更 有 效 - Except_raise 调 用 longjmp 
把 控制 转 给 某 个 处 理 程序 。 如 果 这 个 处 理 程 序 没有 处 理 儿 党， 时 么 Except_raise 会 再 次 调用 
longjmp 。 如 果 要 处 理 异 常 的 是 异常 栈 中 的 第 N 个 异常 帧 ， Except. raise 和 longjmp 将 会 被 调用 N 
次 。Roberts 的 实现 只 需要 调用 -次 就 能 找到 相应 的 处 理 程序 或 是 找 到 第 一 个 FINALLY 从 名。 
为 了 达到 这 个 效果 ， 它 必须 对 TRY-EXCEPT 洁 铝 中 的 因 常 处 理 程序 的 数 日 BR -个 上 界 。 
SEC 端 译 器 ， 如 微软 的 c 编 详 器 ， 就 提供 了 结构 化 的 异常 处 理工 具 作 为 稳 序 设计 语言 的 扩展 。 

一 些 程序 设计 请 言 同样 也 嵌入 了 断言 机 制 ， 例 如 Eiffel。 大 多 数 程序 设计 河童 使 用 的 是 
类 人 assert 宏 指令 或 片 他 编译 指令 的 工具 来 括 明 断 汪 例如、Digital 的 Modula-3 编 详 器 可 以 
识别 形 如 <*ASSERT expression*> 的 注释 作为 户 明 断 六 的 编译 参数 。 Maguire(1993) 用 了 - 
整 章 来 介绍 了 C 程 序 中 断 证 的 使 用 。 


练习 


41 BEAEXCEPT 义 有 FINALLY 的 诈 句 ， 其 执行 效果 如 何 ? 诺 何 的 形式 为 


ESNE __ #7 
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4.5 


4.6 


TRY 
s 
EXCEPT (Ce) 
$i 


EXCEPT(e,) 
Sn 

FINALLY 
So 

END_TRY 


Bi Excepthkriij3:3R, (Except raise 从 济 用 iongjmp 米 找到 相应 的 处 理 程序 或 
FINALLY A4], ， 就 像 上 面 内 容 描述 的 ， 册 Roberts(1989) 实 现 的 程序 一样 . 

UNIX 系 统 使 用 信号 来 通知 某 些 异 常情 况 ， 例 如 浮 点 溢出 或 足 用 户 点 击 了 中 断 键 。 
研究 UNIX 的 信号 指令 系统 ,设计 并 实现 “个 将 信 母 转变 成 异常 的 信号 处 理 程序 的 
接口 。 

当 程 序 被 终止 时 ， 一 些 系统 会 打印 出 栈 的 记录 。 在 稳 序 终止 时 ， 这 些 记 录 会 显示 出 
过 程 调 用 栈 的 状态 ， 还 可 能 包括 过 程 名 和 和 参数。 修改 Except_raise， 当 出 现 未 处 理 
的 异常 时 打印 出 栈 的 记录 。 根 据 计 算 机 的 调用 习惯 ， 你 可 能 会 打印 出 过 程 名 以 及 调 
用 的 行 号 。 例 如 ， 记 录 的 形式 可 能 如 下 : 


Uncaught exception Assertion failed 
raised in whilestmt() at stmt.c:201 
called from statement() at stmt.c:63 
called from compound() at decl.c:122 
called from funcdefn() at decl.c:890 
called from declO at decl.c:95 
called from program() at decl.c:788 
called from main{) at main.c:34 
aborting... 


在 - - Hb, SRR MERON, THRO RAE. A AK KIR 
BLOF AGE, RANA AN. MRM RARER PORE, BARR ek 
Except_raise ， 当 出 现 未 处 理 的 异常 时 打开 调试 程序 ， 而 不 足 调 用 abort ， 并 尝试 将 
你 的 实现 形成 产品 程序 ， 也 就 是 说 ,看 看 在 运行 阶段 它 尽 从 会 调用 调试 程序 。 

如 朵 你 时 以 得 到 某 个 C 的 编译 嚣 ， 例 如 1cc(Fraser 和 Hanson 1995), 3[p4 sid eK 
编译 器 ， 但 本 使 用 setjmp 和 longjmp ,使 编译 器 能 够 凤 持 异常 、TRY 语 名 以 及 具有 
本 章 中 描述 的 语法 和 语义 的 RAISE 和 RERATSE 淫 达 式 .你 可 能 需 费 实现 类 似 setjmp 
Allongimp ú ill, (ARE RAP HAA. 例如 ， 只 使 用 少数 的 指令 来 实例 化 
AEE AR OA. BS. 这 个 练习 是 大 型 的 项 日 
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第 5 章 内 存 管理 


所 有 不 平凡 的 C 程 党 都 会 在 运行 阶段 分 配 内 存单 元 的 ， 标 准 的 C 程 序 库 提供 了 四 个 内 在 
管理 的 例 程 :malloc calloc, 、realloc 和 free 。 接口 Mem 用 系列 宏 指 令 和 例 程 重新 包装 了 这 
些 例 各 ， 使 得 这 些 例 程 错 误 喝 少 ， 并 用 还 提供 了 一 些 其 他 的 功能 . 

不 幸 的 足 ， 内 企管 理 错误 在 C 中 是 很 普 让 的， 而 月 它们 通常 很 难 检测 和 修复 -例如 ， 程 
序 片段 ; 

p = malloc(nbytes); 


free(p); 
调用 malloc 来 分 配 ~- 个 大 小 为 nbytes 的 存储 块 (block )， 并 将 存储 块 第 一 个 字 节 的 地 址 赋值 
给 p， 然 后 使 用 p 和 它 指向 的 存储 块 ， 最 后 释放 该 内 存单 元 - 调调 用 完 free 后 , p 中 存储 指针 
BE BCS Bel EF. A 一 个 指向 逻辑 上 并 不 存在 的 内 在 单 元 的 指针 。 随 后 对 p 的 同 接 引用 就 会 产 
生 错误 ， 尽 管 存储 块 并 没有 央 为 其他 的 目的 而 被 重新 分 配 ， 而 这 个 错误 也 很 难 检测 到 ， 即 使 
检测 人 到 了 ， 上 其 发 生地 和 发 生 时 间 也 可 能 是 远 讽 错误 源 的 . 

程序 片段 ; 

p = malloc(nbytes); 

free(p); 


free(p); 
说 明了 另 -种 错误 ; 释放 空闲 内 存单 元 ， 这 个 错误 通常 会 破坏 内 存 管理 函数 所 使 用 的 数据 结 
构 ， 但 是 它 可 能 直到 下 -次 这 些 畏 数 被 调用 时 才 被 发 岗 ， 

另 … 个 错误 是 释放 的 内 存单 元 并 不 是 由 malloc , callocirealloc4} Bc B9 , BIW 


char buf[20], *p; 
if (n >= sizeof buf) 
p = malloc(n); 
else 
p = buf; 
Free(p); 
Lim pt Pr BE FPF B) H Bu Se, Yebuf BLA DA FS En ib 9x IP Es (FUE ipfi buat, +ë 
码 调 用 free 就 会 引起 错误 。 而 且 ， 这 个 错误 通常 会 破坏 内 企管 理 的 数据 结构 ， 而 用 到 运行 以 
后 才 会 被 检查 到 - 
最 后 ， 函 数 
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void itoa(int n, char *buf, int size) { 
char *p = malloc(43); 


sprintf(p, "Xd", n); 

if (strlen(p) >= size - 1) { 
while (--size > 0) 

*buft+ = '*'; 

*buf = '\0'; 

} else 
strcpy(buf, p); 

H 


Fi sdb fal 35 Sm RIT 388 AA buf [O..size-1], "AGRIS E Fsize-l PFA A "MM 
数组 。 这 个 代码 看 上 去 很 健壮 ， 但 足 它 却 至 少 包含 了 两 个 销 误 ， 第 一 个 错误 ， 当 分 瑟 失 败 时 
malloc 会 返回 个 空 指针 ， 呵 代码 并 没有 检测 该 情况 .第 = 个 错误 ， 代 到 产生 了 内 存 泄漏， 
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它 关 没有 将 它 分 配 的 内 存单 元 收回 。 在 每 次 洞 用 itoa 时 ， 程 序 会 慢 慢 地 消耗 内 存 。 如 果 itoa 被 
ARAWN, WARF Bla SRA fm 导致 失败 。 同 时 ， 当 size 小 于 2 的 时 候 ，itoa 仍 然 会 让 
傅 地 工作 ， 但 是 它 将 buf[0] 置 成 了 空 字符 。 可 能 在 某 个 更 好 的 设计 中 会 要 求 size 必 须 超 过 2 ， 
并 用 一 个 可 检查 的 运行 期 错误 来 增强 该 限制 条 件 。 

Mem 搂 口中 的 宏 指 令 和 例 程 提供 了 一 些 保护 措施 来 防 小 这 类 内 存 管理 错误 的 发 生 。 但 是 
它们 并 没有 消除 这 类 错误 。 例 如 ， 它 们 不 能 防止 间接 引用 已 破坏 的 指针 或 是 使 用 超出 了 范围 
的 局 部 变量 指针 等 等 。C 初 学 者 通常 会 犯 后 面 一 种 错误 ， 以 下 这 个 简单 版 本 的 itoa 勇 数 就 是 
这 样 的 例子 : 


char *itoa(int n) { 
char buf[43]; 


sprintf(buf, "Xd", n); 
return buf; 


} 
—Bitoaj& ll iy 2 AaB abut yj AL, bULAA BEE AT 


5.1 接口 


Memik O Sih (St. CMR ES: 


(mem. n= 
#ifndef MEM_INCLUDED 
#define MEM_INCLUDED 
#include "except.h" 


(exported exceptions 70) 
(exported functions 70) 
(exported macros 70) 


#endif 
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Mem fy 4} Ñu ell 3 5 E AEC e BY EH B0 4) Bn EE DL, I EA BR E k AAD 280 89 23 AC, 
也 不 会 返回 空 指针 : 
(exported exceptions 70)= 


extern const Except T Mem Failed; 


(exported functions 70)= 
extern void *Mem alloc (long nbytes, 
const char *file, int line); 
extern void *Mem calloc(long count, long nbytes, 
const char *file, int line); 


Mem alloc F BË -个 大 小 至 少 为 nbytes B6 (HH, FEI -个 指向 第 一 个 字 节 的 指针 。 
该 存储 块 总 按 某 个 地 址 边界 进行 调整 的 ， 这 种 调整 通过 有 很 严格 的 边 喝 测 整 要 求 的 数据 得 以 
实现 。 人 存储 块 中 的 内 容 是 未 初始 化 的 。 如 果 mbytes 是 -- 个 非 止 数 ， 那 么 这 将 是 一 个 可 检查 的 
运行 期 错误 。 

Mem_calloc 分 配 足 够 大 的 存储 块 ， 使 得 可 以 存 下 count 个 元 素 的 数组 ， 每 个 元 素 的 大 小 
为 nbytes ， 并 返回 一 个 指向 争 一 个 元 素 的 指针 。 存 储 块 采用 与 Mem_alloc 相同 的 边界 调整 ， 
并 被 初始 化 为 0。 空 指针 和 0.0 并 不 -- 定 会 表示 成 0， 因 此 Mem_calloc 可 能 会 不 正确 地 初始 化 
fee Bts WReount nbytes 为 非 止 数 ， 耶 么 这 也 是 -个 可 检查 的 运行 期 错误 。 

Mem_alloc 和 Mem_calloc 的 最 后 两 个 参数 是 调用 所 在 文件 的 文件 名 和 行 号 ”它们 由 下 面 
的 宏 指令 来 给 出 ， 这 些 宏 指令 也 是 调用 这 些 函 数 的 最 常用 的 方式 。 


(exported macros 70)= 
#define ALLOC(nbytes) \ 


Mem alloc((nbytes), _FILE__, . LINE ) 
#define CALLOC(count, nbytes) Ñ 
Mem calloc((count), (nbytes), . FILE , . LINE...) 


如 果 Mem_alloc 或 是 Mem_calloc 不 能 分 配 所 要 求 的 内 存单 元 , 部 么 它们 会 产生 异常 Mem_Failed , 
并 将 file 和 line 传 给 Except_raise ， 将 产生 错误 的 位 置 写 人 异常 报告 中 。 如 果 fie 是 空 指针 ， 那 么 
Mem_alloc 和 Mem_calloc 将 在 Mem_Failed 异 常 的 实现 中 将 位 着 信 息 补充 上 。 

许多 分 配 操 作 具 有 以 下 格式 : 


struct T *p; 
p = Mem_alloc(sizeof (struct T)); 


它 为 结构 了 的 茶 个 实例 分 配 - -个 内 存单 元 ， 并 返回 一 个 指向 该 内 存单 元 的 指针 。 这 种 习惯 用 
法 的 更 好 形式 足 

p = Mem_alloc(sizeof *p); 
用 sizeof *pttMsizeof(siruct T)， 这 样 对 除了 空 指针 以 外 的 任何 类 型 的 指针 都 可 以 完成 分 配 ， 
并 且 sizeof *p 是 独立 于 指针 类 型 的 。 如 果 p 的 类 型 改 迹 了 ， 这 种 分 配 仍然 是 全 确 的 、 但 是 如 
ARAE FIR Jsizeof(struct T) ， 就 必须 修改 语句 来 反映 p 的 类 型 变化 、 也 就 是 说 语 条 


p = Mem alloc(sizeof (struct T)); 
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FU fEp 683: 2 38m POT SET EZ E E BB. 如 果 p 变 成 了 指向 另 一 个 结构 的 指针 ， 而 这 

个 调用 没有 吏 新 ， 缉 么 该 调用 就 可 能 分 配 过 多 的 内 存单 邱 ， 这 样 会 造成 空间 的 浪费 ;或 者 分 

妃 过 少 的 内 存单 元 ， 这 样 客户 调 几 程序 有 可 能 对 未 分 配 的 内 存单 天 中 的 内 容 进行 修改 ， 这 将 

带 米 严重 的 问题 。 
这 种 分 配 习惯 是 很 常 在 的 ， 央 此 Mem 提 供 的 宏 指 令 封 奖 了 分 配 和 赋值 操作 : 
(exported macros 70)H= 


#define NEW(p) ((p) = ALLOC((long)sizeof *(p))) 
#define NEWO(p) ((p) = CALLOC(1, (long)sizeof *(p))) 


NEWA lE Y — ARE ed BY (e bi BOR TERE p ， 并 把 在 储 据 的 地 址 赋 给 p 、NEW0(p) 完 成 而 
样 的 功能 ， 不 同 的 是 它 同时 也 清除 了 存储 块 中 的 内 容 。 提 供 NEW 是 建立 在 假设 入 多 数 客户 
调用 程序 会 在 分 配 后 立即 对 内 存单 元 进行 初始 化 的 基础 之 上 的 。 编 译 阶段 的 操作 符 sizeof 的 
参数 只 用 来 指明 它 的 类 型 ， 在 运行 阶段 并 天 求 值 . 央 此 NEW 和 NEW0 只 对 p 求 一 次 值 ， 并 且 
在 这 两 个 宏 指令 中 使 用 具有 附加 功能 的 表达 式 作 为 实 参 也 是 很 安全 的 。 例 如 NEW (afi++]) 。 

malloc 和 calloc 都 用 了 size_t 类 型 的 参数 ; sizeof 产生 .个 size_t 类 型 的 常数 ， 类 型 size t 
足 一 个 无 符号 的 整数 类 型 ， 可 以 表示 能 声明 的 最 大 对 象 的 大 小 ， 并 上 不 管 对 象 的 大 小 在 哪里 
指定 ， 忆 部 可 以 在 款 准 的 库 函 数 中 使 用 。 实 际 上 ，size_t 县 订 以 是 天 符号 的 整数 ， 也 可 以 是 
无 符号 的 长 整数 ，Mem_alloc 和 Mem_calioc 采 几 整 型 参 数 ， 以 避免 出现 将 负数 传 给 无 符 叶 参 
数 的 错误 。 例 如 : 


int n = -1; 





p = malloc(n); 
ARI, MEH Smalloci CMBR AR BEC ER. A- ERA r 一 
size_t 类 型 的 数 后 ， 通 常 是 一 个 很 大 的 无 符号 数 。 

PATE AT BURG Ha Mem. free cU: 


(exported functions 70)+= 
extern void Mem.free(void *ptr, 
const char *file, int line); 


(exported macros 709 
define FREE(ptr) ((void)(Mem freeCCptr), Ñ 
—FILE_, LINE 2, (ptr) = 0) 
Mem_free 接 收 一 个 指向 需 被 释放 的 存储 块 的 指针 作为 参数 ， 如 果 ptr 不 为 空 ， 那 么 Mem_free 
释放 该 存储 块 ; 如 果 ptr 为 帘 、 耶 么 Mem_ 和 fee 什么 也 不 做 ， 宏 指令 FREE 同 样 接收 一 个 指针 作 
为 参数 ， 并 调用 Mem_free 来 释放 作 储 块 ， 然后 将 ptr 赋 为 空 指针 ， 就 像 2.4 节 中 提 到 的 部 样 。 
这 样 可 以 帮助 我 们 避免 出 现 悬 挂 指针 。 因 为 ptr 在 它 昕 指 的 对 象 被 释放 后 ， 就 变 为 空 ， 因 此 此 
后 的 间接 引用 通常 会 因为 某 类 型 的 地 几 错误 而 引起 程序 崩溃 _ 这 种 明显 的 错误 比 问 接 引用 某 
个 县 挂 指针 可 能 引起 的 不 可 预测 的 后 果 要 好 的 多 。 注 意 : FREE 灶 ptr 进 行 了 多 次 求 值 。 
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在 随后 章节 的 细节 描述 中 , 将 有 两 个 实现 导出 Mem 接 口 ， 校 验 实现 (checking implementation ) 
通过 检 淹 运行 斯 错误 以 恬 助 拓 获 新 一 节 中 所 描述 的 都 些 存 取 访问 错误 。 硒 该 实现 中 ， 如 果 将 -个 
并 不 是 由 Mem_alloc 、Mem_calloc 或 Mem_resize 返 回 的 非 袍 ptr 或 者 某 个 已 经 传 给 Mem_free 或 
Mem resize 的 pt 位 给 Mem_free 时 ， 会 户 半 可 检查 的 运行 期 错误 。Mem_free 为 fle 和 line 参 数值 用 来 
di poe TER 

但 足 ， 在 产品 级 实现 (production implementation ) f, 3x 26¢¢ ci; ERER RT 30: 
查 的 运行 期 错 庶 。 

函数 : 


(exported functions 70)+= 
extern void *Mem resize(void “ptr, long nbytes, 
Const char *file, int line); 


(exported macros 70)+= 

$define RESIZE(ptr, nbytes) ((ptr) = Mem resize((ptr), \ 
(nbytes), _FILE_, LINE) 

变 了 前 面 调用 Mem alloc 、Mem_calloc 或 Mem_resize 分 配 得 到 的 存 鱼 块 的 大 小 。 与 
Mem_free 一 样 、Mem_resize 的 第 一 个 参数 存放 需要 改变 大 小 的 在 铺 块 的 地 十 的 指针 。 
Mem.resize 扩 人 完 或 缩小 该 存储 块 ， 使 它 至 少 有 npytes 的 存储 单 苑 ， 进 行 适当 的 边界 调整 ， 并 
返回 一 个 指向 调整 过 的 在 储 块 的 指针 。Mem_resize 为 了 改变 存储 鼎 的 大 小 ， 可 能 会 移动 该 存 
WR. DA Use A F Mem resize (fF 2980 — PARERE. ptr 复制-… 部 分 或 所 有 的 数据 
BLM FRET, JEROEpIC. WN Mem_resize 4 REZHRI— PRY EHR, ER APA IE 
Hi Mem. Failed, file 和 line 为 异常 产生 的 位 置 , 宏 指 今 RESIZE 将 ptr 的 指向 改 为 新 的 存储 块 ， 
Et Mem resize PISTE. 注意 : RESIZE 也 对 ptr 进 行 了 多 次 的 求 值 。 

如 果 Pbytes 超 过 了 ptr 指 向 的 企 储 块 的 大 小 ， 那 么 多 余 的 字 节 将 不 被 初始 化 。 否 则 ， 从 ptr 
开始 的 nbytes 将 被 复制 到 新 的 存储 块 中 。 

如 果 将 实 的 pt 优 给 Mem_resize ， 或 是 nbytes 为 非洲 数 ， 会 产生 可 检查 的 运行 期 错误 。 在 
校 验 实现 中 ，pt 不 是 出 前 面 Mem_alloc , Mem_calloc 或 Mem_resize 的 调用 所 返回 ， 或 是 由 
经 传递 给 Mem_free 、Mem_resize 的 ptr 传 递 给 Mem_resize ， 这 是 -个 可 检查 的 送行 期 错误 。 
而 在 产品 级 实现 中 ， 这 些 存 到 错误 都 是 厅 可 检查 的 运行 期 错误 。 

Mem8i 1 中 的 函数 可 必用 做 CERME PE pR Hamalloc 、callec 、 Tealloc 和 和 free 的 补充 ， 也 就 是 
说 ， 程 序 此 可 以 使 用 标准 C 库 陋 数 中 的 分 配 两 数 ， 也 可 以 使 用 Mem 接 口中 的 分 配 瑞 数 。 只 将 
1625 BOR AE BI AE SA PS Ze. He BO E 247 ERR TE EAR 
序 由 ， 只 能 使 用 一 个 Mem 接 口 的 实现 。 


5.2 产品 级 实现 


丰产 品级 实现 中 ， 例 各 将 标准 两 数 序 的 内 存 管理 晒 数 的 调用 封装 存 由 Mem 接 口 说 明 的 更 
安全 的 程序 包 中 ， 
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(mem o= 

` #include <stdlib.h> 
#include <stddef.h> 
#include "assert.h" 
#include “except.h" 
#include "mem.h" 


(data 74) 
(functions 74) 


例如 ，Mem_alloc 调 用 malloc ， 并 在 malloc 返 回 空 指针 时 ， 产 生 蜡 常 Mem_Failed: 


(functions 74)= 
void *Mem alloc(long nbytes, const char “file, int tine) 
void *ptr; 


assert(nbytes » 0); 
ptr = matloc(nbytes); 
if (ptr == NULL) 
(raise Mem Failed 74) 
return ptr; 
了 


(raise Mem, Failed 74)= 
t 
if (file == NULL) 
RAISE(Mem_Failed); 
else 
Except_raise(&Mem_Failed, file, line); 


H 


(data 74 
const Except T Mem Failed = { "Allocation Failed" }; 


ARA Ade PU WA BA BUE IE Mem Failed £t, Hl Z Except, raise £r sug 3 bf, 
Tes EA TEE TREES RAISES CHR V BH Fe Mem, alloc, 例如， 


Uncaught exception Allocation Failed raised @parse.c:431 
aborting... 


3f HE, Mem, calloc 函数 出 封装 了 对 calloc 的 调用 : 


(functions 74)4= 
void *Mem_calloc(long count, long nbytes, 
const char “file, int line) { 
void *ptr; 


assert(count > 0); 
assert(nbytes > 0); 
ptr = calloc(count, nbytes); 
if (ptr == NULL) 

(raise Mem Failed 74) 
return ptr; 
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当 count 或 abytes 为 0 时 ，calloc 的 行为 在 实现 中 给 出 了 定义 ，Mem 接 口 说 时 了 在 这 些 情 况 下 
会 发 生 什 么 ， 这 也 是 它 的 优点 之 ,并 可 以 帮助 避免 错误 的 发 生 。 
Mem_free 仅 仪 调用 明 数 free ; 


(functions 74)+= 
void Mem_free(void *ptr, const char *file, int line) { 
if (ptr) 
free(ptr); 
} 


d TEIG Foo Bat Fe HH PR Br GR ree, IB AMem_free ftir, WW free MIEN KHAN 
接收 空 指针 。 
Mem_resize 比 realloc 函数 的 说 明 简单 得 多 ， 这 在 其 更 简单 的 实现 中 等 到 「 反 映 : 


(functions 74)+= 
void *Mem_resize(void *ptr, long nbytes, 
const char *file, int line) { 


assert(ptr); 
assert(nbytes > 0); 
ptr = realloc(ptr, nbytes); 
if (ptr == NULL) 
(raise Mem Failed 74) 
return ptr; 
1 


Mem resize 的 惟一 月 的 就 是 改变 一 个 已 在 在 的 存储 块 的 大 小 。realloc 也 可 以 完成 同样 的 功能 ， 
但 是 当 nbytes 为 0 时 ，realloc 间 时 释放 了 该 存储 次 ; 而 当 ptr 为 空 指针 时 ，realloc 也 同时 分 配 
了 某 个 存储 块 。 这 些 附 加 的 功能 与 改变 某 个 已 存在 的 存储 块 的 大 小 的 关系 并 不 大 ， 但 总 却 引 
AS RIK 


53 校 验 实现 


Mem 接 口 的 以 验 实现 所 导出 的 函数 可 以 捕获 在 本 章 的 一 开始 提 到 的 于 类 存 芭 访问 策 误 ， 
并 把 它们 作为 可 检查 的 运行 期 错误 来 报告 。 


(memchk.c)« 
#include <stdlib.h> 
#include <string.h> 
#include "assert.h" 
#include "except.h” 
#include "mem.h" 


(checking types 80) 
(checking macros 79) 
(data 74) 

(checking data 77) 
(checking functions 79) 
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如 果 Mem_alloc , Mem_calloc #IMem_resize AR AG AIK IB HRA EXE, FRA ESE 
记 住 它们 返回 的 所 有 地 址 ， 以 及 如 个 地 址 指向 已 SACHA 262836, XE Mem free 
Mem_resize 就 可 以 检查 到 夺 皮 访问 错误 。 埋 论 上 说 ， 这 此 图 数 都 保 人 在 有 - DRES, HER 
都 是 一 元 组 (Cg，free ) 3 (a, allocated )， 上 其 中 是 由 分 配 操 作 返 回 的 地 址 .和 值 free 说 明 地 
址 ac 不 青 指 向 分 配 的 内 存单 元 ; 也 就 是 说 该 内 存单 亢 已 经 明确 地 释放 I, ifii füallocated Ui sH 
地 址 & 指 向 已 分 配 的 存储 单元 。 

Mem_alloc 和 Mem_calloc 深 加 一 个 一 元 组 (ptr,allocated) 到 集合 5 中 ， 上 其 中 ptr 是 它们 的 返 
回 值 ， 并 且 它 们 保证 在 漆 加 之 前 、5 中 不 会 出 现 (ptr,allocated) 或 (ptz,free)。 当 ptr 为 裕 ， 或 者 
(ptrallocated) ES FI}, Mem free(ptr) 是 合法 的 。 如 凡 ptr 不 为 完 ， 卫 (ptr,allocate 由 已 经 在 $ 
中 人 存在， 那么 Mem_free 将 释放 ptr 指 向 的 内 存单 邢 ， 并 将 集合 ?中 的 相应 元素 项 改 为 (ptrfree) - 
同样 ，Mem_resize(ptr,nbytes,…) 也 只 有 在 (ptr,allocated) 已 经 在 S$ 中 存在 时 才 是 合法 的 。 如 果 
是 这 样 ， 那 么 Mem_resize 调 用 Mem_ailoc 分 配 一 个 新 的 存储 块 ， 将 原来 存储 居中 的 内 容 复制 
到 新 的 存储 块 中 ， 并 调用 Mem_free 释 放 原 来 的 存储 单元 ， 这 些 测 几 都 会 使 集合 5 产生 相应 的 
变化 。 

对 于 分 配 阮 数 永 远 不 会 两 次 返回 相同 的 值 的 情况 ， 可 以 采用 京 不 释放 全 何 内 企 单元 米 实 
现 。 但 是 这 个 方法 浪费 了 空间 ， 一 个 喝 好 的 黎 法 是 ， 永 不 苹 放 基 个 分 配 范 数 先前 返回 的 地 址 
中 的 字 节 3 也 可 以 通过 保存 -个 这 些 字 节 的 地 址 才 来 实现 

这 些 方 案 可 以 通过 在 标准 库 旺 数 的 并 头 写 一 个 内 在 分 配 程 序 来 实现 。 这 个 分 号 程序 保存 
含有 存储 块 权 述 符 的 … 个 散 询 表 : 

(checking data 77)= 

Static struct descriptor { 
struct descriptor *free; 
struct descriptor *link; 
const void *ptr; 
long size; 
const char *file; 
int line; 

} *htab[2048]; 


purse Fete Se ay J nh. BAR e HE PTA Bb Mo SPAY 5 size BEY Ab. file 





和 jine 足 存 情 块 的 分 配 位 置 一 一 A, BORE A a PRCA rb RAS RE OT NUR RO 、 
UE ELIGE Rh PP. CE BR [DUE MA EEE E dT ED B e 
link FEJER 个 在 htab 中 具有 相 问 散 列 值 的 岂 描 述 符 链 表 ， 而 htab 是 一 个 指向 这 些 描述 
符 的 指针 数组 。 这 些 描述 符 同 样 也 形成 了 个 空 闪存 储 块 的 能 表 ; RER RR EA 
的 描述 符 . 
(checking data 77)+= 
static struct descriptor freelist = í &freelist }; 


并 有 旦 该 链表 中 通过 描述 符 中 的 free 字 段 连 起 米 的 。 沪 链表 也 足 循环 的 ，freelist 是 链表 中 的 最 
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后 ARER, E Wree EHE GR TiU, 在任 休 时 候 ，htab 都 在 有 所 有 存储 块 的 描 
述 符 ,和 包括 空闲 的 和 已 分 记 的 , 冠 闲 的 存储 块 存在 freelist 中 因此， 如 果 存 储 块 足 已 分 配 的 ， 
那么 free 字 段 的 值 为 室 如果 存 储 块 是 空 败 的 ,那么 free 宁 上段 的 值 不 为 空 ， 并 共用 htab 来 实现 
集合 8: 图 5-1 显 示 了 某 个 时 间 点 这 些 数据 结构 的 状态 。 与 每 个 描述 符 结构 相关 联 的 空间 出 现 
在 描述 符 结 构 的 后 而 BEA S ET 分 配 的 ， 而 空白 的 空间 明 空 闲 的 ， 从 link 字 段 连 出 来 
KEKR, TERE RE SAAR, 
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图 5-1 hrab üfreelist ait 


给 定 一 个 地 址 ， 函 数 find 查 找 它 的 撕 述 符 ， 它 返回 -个 指向 描述 符 的 指针 或 者 返回 一 个 
空 指针 ; 


(checking functions 79)= 
static struct descriptor *find(const void *ptr) { 
struct descriptor *bp - htab[hash(ptr, htab)]; 


while (bp && bp-»ptr !- ptr) 
bp = bp->Tink; 
return bp; 
} 


(checking macros 79) 
define hash(p, t) (((unsigned long)(p)»»3) & \ 
(sizeof (t)/sizeof ((2[0])-D) 
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hash #48 vA f ak oe Ab HEL, ABS, MMA EI hta KRR MMAR 
访问 错误 在 运行 期 可 测 到 的 版 本 Mem, free, finde EWS : 


(checking functions 79)+= 
void Mem free(void *ptr, const char *file, int line) { 
if (ptr) { 
struct descriptor *bp; ` 
(set bp if ptr is valid 79) 
bp-»free « freelist.free; 
freelist.free - bp; 


} 
SR ptrdEzs HE — 4 AR AOE, ABA TERE OE OG PLE ES ADI E W PE RUE 
MERER, 并且 可 以 通过 以 后 的 Mem_alloc 调用 来 重新 使 用 。 当 指针 指向 某 个 已 分 配 的 
存储 块 时 称 该 指针 是 有 效 的 : 


(set bp if ptr is valid 79)= 
if (((unsigned long)ptr)X(sizeof (union align)) != 0 
|| (bp = find(ptr)) == NULL || bp->free) 
E25] Except raise(&Assert. Failed, file, line); 


甚 中 的 测试 语句 ((unsigned long)ptr)%(sizeof (union align))!-0 Bg T x XX Hb ht BJ Tfind ig 
数 ， 这 些 地 址 不 是 最 严格 UME LC BUS, PIU ST He o RUM EE HR IET 。 

ART EERIE, Mem, alloc3& [af] IRE BE He TH hei) U EAL IU. BEE 
是 以 下 共用 体 大 小 的 倍数 ; 


(checking types 80)= 

union align { 
int i; 
long 1; 
Tong *1p; 
void *p; 
void (*fp) (void); 
float f; 
double d; 
long double 1d; 





); 
这 种 边界 调整 保证 任何 类 型 的 数据 都 可 以 存储 在 出 Mem_alloc 返 图 的 存储 块 中 。 如 果 传递 给 
Mem_free 的 pt 没有 按 这 个 边界 调整 ， 都 么 它 可 能 不 在 htab 中 ， 闪 此 可 能 是 元 效 的 。 
Mem.resize 通 过 同样 的 检查 来 捕获 存 取 错误 . 然后 调用 Mem_free 、Mem_alloc 以 及 库 函 
数 memcpy: 


(checking functions 79)}+= 
void *Mem_resize(void *ptr, long nbytes, 
const char *file, int line} { 
struct descriptor *bp; 
void *newptr; 


Aa EB 
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assert(ptr); 


assert(nbytes > 0); 
(set bp if ptr is valid 79) 
newptr = Mem alloc(nbytes, file, line); 
memcpy (newptr, ptr, 

nbytes < bp->size ? nbytes : bp-»size); 
Mem free(ptr, file, Tine); 
return newptr; 


} 


同样 ，Mem_calloc 也 可 以 通过 调用 Mem_alloc 和 库 函 数 memset 来 实现 ， 


(checking functions 794 
void *Mem calloc(long count, long nbytes, 
const char *file, int line) { 


void *ptr; 


assert(count 


> 0); 


assert(nbytes > 0); 
ptr = Mem alloc(count*nbytes, file, line); 
memset(ptr, 'NO', count*nbytes); 


return ptr; 


} 


竹下 来 的 就 是 分 配 丧 述 符 本 身 以 及 Mem_alloc 的 代码 了 上 。 想 要 用 -次 分 配 同 时 完成 这 两 
个 任务 ， 一 种 办 法 就 是 分 配 一 个 足够 大 的 存储 块 ， 既 可 以 存储 担 述 符 也 可 以 存储 Mem._alloc 


调用 所 需 的 存储 空间 。 这 种 方法 有 两 个 缺点 : 首先 ， 它 增加 了 难度 ， 
决 划 分 成 满足 要 求 的 几 个 更 小 的 块 ， 而 每 个 


要 把 空闲 的 内 存单 元 
需求 都 必须 有 它 自己 的 撒 述 符 ; 其 次 ， 它 使 得 措 








述 符 很 容易 因 借 动 指 针 或 指 向 分 配 的 存储 块 以 外 的 索引 的 写 操作 侧 被 破坏 。 

分 配 措 述 符 分 别 将 它们 的 分 配 从 Mem_alloc 中 分 离 出 米 ， 这 样 减 少 本 它们 被 破坏 的 机 会 ， 
但 是 不 能 消除 这 种 可 能 性 。dalloc 分 配 、 初 始 化 并 返回 “个 描述 符 ， 将 其 从 出 malloc 得 到 的 
512 个 描述 符 其 中 分 离 出 来 : 


(checking functions 79)+= 
static struct descriptor *dalloc(void *ptr, long size, 
const char *file, int line) { 
static struct descriptor *avail; 
Static int nleft; 


if (nleft <= 0) ( 
(allocate descriptors 82) 


nleft - 
} 
avail->ptr 
avail->size 
avail->file 
avail->line 
avail-»free 
nleft--; 


NDESCRIPTORS; 


ptr; 
size; 
= file; 
= line; 
= avail-»link 


[ED 


= NULL; 
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return avail++; 


} 


(checking macros 79)+= 
#define NDESCRIPTORS 512 


调用 malloc 可 能 会 返回 -4 OSH ET, Mdalloc 又 把 这 个 空 指针 传递 给 datloe 的 吝 用 者 ， 


(allocate descriptors 82)= 
avail = malloc(NDESCRIPTORS*sizeof (*avail)); 
if (avail == NULL) 
return NULL; 


就 像 以 下 要 说 明 的 ， 当 dalloc 返 回 一 个 空 指针 时 ，Mem_alloe 会 产 和 牛 Mem_Failed 异 常 。 

Mem_allec 对 存储 块 的 分 配 使 用 的 是 众多 内 存 分 配 算法 中 的 firstfit 算 法 。 它 搜索 freelist 
链表 ， 找 色 第 一 个 能 够 满足 分 配 贾 求 的 在 储 块 ， 然 后 从 该 存储 块 中 划分 出 所 需要 的 存储 块 。 
如 果 freelist 链 表 中 没有 合适 的 存储 块 ，Mem_alloc 将 调用 malloc 分 配 一 个 人 于 nbytes 的 内 存 
卖 ， 并 把 它 加 到 空闲 的 链表 中 ， 然 后 再 次 查找 freelist 列 家 .因为 新 的 内 存 块 大 于 nbytes ,在 
第 一 次 查找 的 时 候 ， 它 就 作为 满足 分 配 更 求 的 企 储 块 进行 分 号 。 代 码 如 下 : 

(checking functions 79)+= 

void *Mem alloc(long nbytes, const char *file, int line){ 


struct descriptor *bp; 
void *ptr; 


assert(nbytes » 0); 
(round nbytes up to an alignment boundary 83) 
for (bp = freelist.free; bp; bp = bp-»free) í 
if (bp->size > nbytes) í 
(use the end of the block at bp->ptr 83) 
} 
if (bp == &freelist) { 
struct descriptor *newptr; 
(newptr e a block of size NALLOC + nbytes 84) 
newptr->free = freelist.free; 
freelist.free = newptr; 
H 
1 
assert(0); 
return NULL; 


) 
Mem_alloc 先 把 nbytes 向 上 取 幕 ， 使 得 它 返回 的 等 个 指针 都 是 共用 体 align 大 小 的 倍数 ; 


(round nbytes up to an alignment boundary 83)= 
nbytes = ((nbytes + sizeof (union align) - 1)/ 
(sizeof (union align)))*(sizeof (union align); 


freelist free 36 75 P Le GI He Ge BO e At RUE. th, LQ RTE FRU sth , 第 一 个 大 小 超过 
nbytes 的 存储 块 被 用 来 进行 分 配 。 i 闲 存储 块 底部 的 nbytes 个 字 节 被 分 割 出 来 ， 分 割 出 来 
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BCE PEER 09188 FPO OE. 36 LSE Rg htab TS. 3& lel E GERI Bb hE 


(use the end of the block at bp->ptr a3)= 

bp->size -= nbytes; 

ptr = (char *)bp-»ptr + bp->size; 

if ((bp = dalloc(ptr, nbytes, file, line)) != NULL) í 
unsigned h = hash(ptr, htab); 
bp->Tink = htab[h]; 
htab[h] = bp; 
return ptr; 

} else 
(raise Mem_Fai led 74) 


Hi5-2 URNA r ARERR: AE, CU ACh BE RU = PS 
BJ; fB CS} BOBO Ze B] Hi Be ts ， HERE. 新 描述 符 的 空闲 链 
BNE. 
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图 5-2 分 配 - - 25 PALES EGRE 


测试 语句 bp->size > nbytes 保 证 bp ->ptr 的 值 从 不 会 被 重复 使 用 。 大 的 空闲 存储 块 被 划分 成 
小 的 存储 块 分 配给 小 的 需求 ， 直 到 存储 记 的 大 小 减 小 到 sizeof(union align) 4-3 4, 在 bp ->size 
小 于 nbytes 的 时 候 就 不 再 分 配 了 上 。 每 个 存储 块 的 前 sizeof(union align) 个 字 节 是 从 在 进 行 分 
RB. 

如 果 bp 己 到 达 freelist ( 即 已 搜索 到 链表 的 最 后 AMR), il be hila 4 ot HR 
的 大 小 超过 nbytes .在 这 种 情况 下 ， 一 个 新 的 大 小 为 





(checking macros 79)+= 
#define NALLOC 4096 


加 Enbytes- 71 A 42 BIER, BOT BIAS PLAT HR ERREA; EF UR RERO, qe 
将 会 被 访问 ， 并 用 米 进行 所 需要 的 分 配 。 这 个 新 的 存储 块 也 有 一 个 描述 符 ， 就 好 像 它 先前 已 
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被 分 号 和 释放 过 一 样 ， 


(newptr + a block of size NALLOC + nbytes 84)= 
if ((ptr = malloc(nbytes + NALLOC)) == NULL 
i} Cnewptr = dalloc(ptr, nbytes + NALLOC, 
_FILE_, . LINE. )) == NULL) 
(raise Mem. Failed 74) 


参考 书目 浅 析 


Mem 接 口 的 日 的 之 一 就 是 改进 C 的 分 配 两 数 接 11。Maguire(1993) 对 标准 C 分 配 消 数 进行 
评价， 并 描述 了 一 个 类 似 的 函数 包 。 

内 存 分 配 错误 在 C 程 序 中 是 很 普遍 的 ， 以 至 有 专门 的 公司 致 万 于 开发 并 出 售 这 样 的 工具 ， 
帮助 诊断 和 修复 这 类 的 错误 。 其 中 最 好 的 工具 是 Purify(Hasttngs 和 Joyce 1992) ， 心 能 检查 出 
几乎 所 有 的 存 取 类 镀 误 ， 包 括 在 5.3 节 中 给 出 的 作 取 错误 。Purify 对 每 个 调用 和 存储 指令 部 进 
行 了 检查 ;由 于 它 是 通过 编辑 目标 代码 来 实现 这 样 的 检查 的 ， 因 此 它 在 即使 没有 波 代 码 的 情 
况 下 也 可 以 使 用 ， 例 如 在 私有 库 中 使 用 它 。 利用 源 代码 来 捕获 存 取 错 误 是 另 - .种 实现 方法 。 
例如 ，Austin 、Breach 和 Sohi(1994) 描 述 了 一 个 系统 ， 该 系统 中 的 “安全 ”指针 就 带 有 足够 
的 信息 来 检查 大 量 的 存 取 错 误 。LCLint(Evans 1996) 具 有 像 PC-Lint 一 类 工具 的 许多 特征 a 
以 在 编译 阶段 检查 大 量 潜在 的 内 存 分 配 错误 。 

Knuth(1973a) 研 究 了 所 有 重 归 的 内 存 分 配 算法 ， 并 对 为 什么 first fit 算 法 通常 比 其 他 算法 
《例如 查找 大 小 最 接近 所 要 求 的 存储 块 的 best fit 算 法 ) XE RT 『 解 释 。 在 Mem_alloc 中 使 用 
的 first-fit 算 法 与 8.7 节 中 描述 的 Kernighan 和 Ritchie(1988) 的 算法 很 类 似 。 

大 多 数 内 存 管理 算法 都 有 许多 的 变种 ， 通 常 部 是 为 某 个 特定 的 应 用 或 分 配 模式 设计 的 ， 
以 改善 其 性 能 。Quick fit(Weinstock 和 Wulf 1988) 算 法 是 使 用 最 广泛 的 一 种 算法 。 通 过 观察 ， 
发 现 许多 应 用 中 分 配 的 存储 块 只 有 几 种 不 同 的 大 小 ，Quick Fite TERA Ox — A. 它 保 
存 有 N 个 空闲 的 存储 块 链表 ,每 个 对 应 的 是 使 用 频率 最 高 的 W 种 需求 的 大 小 。 分 配 其 中 一 种 
大 小 的 存储 块 只 需 简单 的 从 相应 的 链表 中 取出 一 块 即 可 ; RECRUIT EER, Fm 
添加 到 相应 的 链表 中 即 可 。 当 链表 为 空 或 所 要 求 的 大 小 不 在 这 NN 个 当中 时 ， 就 使 用 其 他 的 方 
法 ,例如 first fits 

Grunwald 和 Zorn (1993 ) 描述 了 一 种 系统 ， 该 系统 产生 了 适用 十 某 个 特定 应 用 的 malloc 
有 和 free 函数 的 实现 。 他 们 首先 用 不 同 版 本 的 malloc 和 free 运 行 该 应 用 森 序 ， 收 集 关 于 存储 块 大 
Iv, 分配 与 释放 频率 等 等 的 统计 信息 ; 然后 他 们 把 这 些 数据 输入 革 个 程序 ， 该 程序 产生 为 该 
应 由 定制 的 malloc 和 free 函 数 约 源 代码 。 这 些 版 木 的 malloc 和 free 茹 数 通常 对 一 小 部 分 、 专用 
于 某 种 应 用 的 存储 块 大 小 的 集合 使 用 快速 拟 合 。 


练习 


5.1 Maguire(1993) 提 倡 将 未 初始 化 的 内 存单 元 用 一 些 特殊 的 位 卉 式 来 初始 化 ， 这 样 可 


Aw 
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5.2 


5.3 


5.4 


5.5 


VALE Bi WH REAG TER VETE CIE SLE MR :个 好 的 位 模式 的 特征 是 什 
Z? 提出 -个 合适 的 位 模式 ， 并 改变 Mem_alloc 的 校 验 实现 来 实现 该 初始 化 方法 - 
试 着 找 … 个 使 用 这 种 方法 可 以 捕获 到 错误 的 应 用 程序 . 
— LL ££ fe Bid «use the end of the block at bp —>ptr 83> 中 ， 某 个 空 闪 作 储 块 的 大 小 
Hila Flsizeof(union aligm) 个 字 节 ， 那 么 它 可 能 永远 世 不 会 满足 任何 需求 ， 们 是 它 仍 
然 在 空闲 的 存储 快 链表 中 。 修 改 该 程序 的 代码 ， 消 除 这 种 在 储 块 。 你 足 否 能 找到 一 
个 这 样 的 应 用 ， 使 得 通过 对 它 的 度 基 可 以 察觉 到 这 种 改进 的 效果 ， 
大 部 分 first fit 的 实 更 ,都 和 8.7 节 中 给 出 的 Kernighan 和 Ritchie ( 1988 ) 的 实现 - 样 ， 
将 相 邻 的 空转 存储 块 合并 形成 -- 个 更 大 的 容 闲 存储 块 :Mem_alloc 的 校 验 实 现 并 没 
有 合并 相 邻 的 空闲 存储 块 ，、 央 为 它 不 会 返 巴 相同 的 地 址 商 次 ， 为 Mem_alloc 设 计 一 
个 算法 ， 使 得 该 算法 可 以 合并 相 邻 的 空闲 存储 块 ， 亿 又 不 会 返回 由 同 的 地 址 两 次 。 
“ 些 程 序 员 可 能 认为 ， 在 Mem_free 中 产生 Assert_Failure 久 常 ， 似 乎 对 发 和 在 取 销 
误 的 处 理 过 于 天 乓 ， 内 为 如 果 不 正确 的 调用 只 是 被 记录 然后 将 其 忽略 ， 那 么 执行 是 
可 以 继续 的 。 清 实现 ; 
extern void Mem log(FILE *log); 
n fe BH Mem, logh MAAR, BACH log T SiG, MMAR RPE: 
Asser_Failure 异 常 来 通知 发 上 了 存 取 销 误 。 这 些 信息 可 以 记录 不 止 确 调用 及 其 分 
配 的 位 置 。 纲 如 ， 当 Mem_free 被 酒 用 ， 而 参数 指针 指向 的 足 一 个 已 丝 被 释放 了 的 
(HREXRRE, ， 它 有 可 能 给 出 的 信息 为 : 


** freeing free memory 
Mem free(0x6418) called from parse.c:461 
This block is 48 bytes long and was allocated from sym.c:123 


类 似 地 ， 当 Mem_resize 被 请 用 ， 而 参数 指针 指向 的 是 -个 无 效 指 针 时 ， 它 有 可 能 
给 出 的 信息 为 : 


** resizing unallocated memory 
Mem_resize(Oxf7fFF930,640) called from types.c:1101 


fLfrMem Iog(NULL) KiE eff in 3€ WE EHI IRI A K M 

RU SCHURUS Z R RHE VPE EUR EHE FE RR. BR CARTE BEY E gl 
B 一样， 个 内 在 泄漏 就 是 - S ¿FB BE OR VT GI SESI JH, PUS AS n1 E 
DOHC, WA FREF RHES PME, Co At BOX 30 EPR ETT RE RU 
问题 ， 但 是 对 长 期 运行 的 程序 ， 例 如 用 广 技 口 和 服务 器 程序 等 等 ， 就 是 一 个 严重 的 
HET. HEE 








extern void Mem_leak(apply(void *ptr, long size, 
const char *file, int line, void *cD, void *c1); 


SLA TM apply Pi $Ë E) f 85k 32 Bu TEBE c ptr (Hil Ee EE, size Ey 
配 的 大 小 ，file Aline 38 RIZR ORE V, 9 FEL RET DUE 2 EEE e I 464] 





64 


HSE 








c1 传 递 给 Mem_leak .而 这 个 指针 也 作为 apply 的 最 后 一 个 参数 传递 给 apPly 。 
Mem leak 并 本 知道 c1 是 干什么 用 的 ,但 是 呆 能 apply 知道 。apply 和 cl- -起 被 称 做 一 
DAE: 它们 指定 了 一 个 操作 和 一 些 该 操作 的 上 上 下文 专用 的 数据 。 鲍 如 : 


void inuse(void *ptr, long size, 
const char *file, int line, void *c1) ( 
FILE *log = cl; 


fprintf(log, "** memory in use at XpWn", ptr); 
fprintf(log, "This block is Xld bytes long " 
"and was allocated from Xs:XdWn", size, 
file, line); 
} 
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可 能 将 以 下 的 信息 


** memory in use at 0x13428 
This block is 32 bytes long and was allocated from gen.c:23 


写 人 前 一 个 练习 担 到 的 日 志文 件 中 .inuse 的 调用 是 通过 把 它 以 及 日 志文 件 的 文件 
指 镍 一 起 作为 参数 传 给 Mem_leak 来 实现 的 ， 


Mem leak(inuse, log); 


第 6 章 ”进一步 内 存 管理 


大 多 数 malloc 和 free 的 实现 ， 使 用 的 内 存 管理 算法 帮 必 须 其 于 对 象 的 大 小 . 在 前 而 se 
中 所 使 用 的 first fit 算 法 就 是 个 例子 . 在 LR. AP TOCBURC AB E EA BS H B Ac 
Tri] i n], RE AP RS. Rak. BU St A [a] ee jd ag 
ALR AC, KAO BM (destroy ) Al kee nak rik. PERE bP. Bn 
dcc XE S EAS PPR REA UE Gn ét eR, 当 它 结束 该 鹃 数 的 编译 时 一 次 性 释放 分 配 的 所 
有 内 存单 元 。 

基 二 对象 牛仔 期 的 为 存 管理 算法 通常 更 适合 于 这 类 应 用 。 茜 于 截 栈 的 分 配 就 是 这 类 分 配 
算法 的 一 个 例子 ， 但 是 只 有 在 对 象 的 生存 期 mt ed i Rc An RT VARI, dris bic DuC ETE dE 
如 此 ， 

本章 讲述 了 一 个 内 存 管理 接口 以 及 它 的 实现 ， 它 使 用 的 是 基 十 实 存 块 (arena ) 的 算法 ， 
该 算法 从 某 个 实在 块 空间 中 分 配 内 存单 元 ， 释 放 时 a w wong 如 果 调 用 
malloc， 要 求 后 面 必须 测 用 free 。 就 像 前 面 章节 小 计 论 的 : 样 ， 实 际 上 很 容易 忘记 调用 free , 
更 糟糕 的 是 释放 某 个 已 经 被 释 放 过 的 对 象 ， 或 足 释放 革 

使 用 基 才 实在 块 的 分 配 程序 ， 不 一 定 每 次 调用 malloc 后 就 一 定 部 贤 对 应 调用 free; 对 在 
实 存 块 空间 内 的 所 有 内 存单 元 的 释放 ， 只 需 在 最 后 用 .个 free 稳 放 调 用 就 可 以 了 -使 用 菜 于 
实 存 块 的 分 配 程序 ， 分 配 和 释放 都 更 有 效 ， 也 没有 任 储 漏洞 。 而 该 方案 一 个 最 重要 的 好 处 足 
它 简化 了 代码 。 合 用 算法 (Applicative algorithm ) 分 配 新 的 数据 结构 市 不 是 改变 已 仓 在 的 
某 个 数据 结构 。 基 于 场 的 分 配 程序 鼓励 使 用 简单 的 合用 算法 代 堆 邢 些 更 复 尔 的 算法 ， 这 些 算 
法 可 能 会 更 有 效 地 利用 空间 ， 但 总 必须 记 住 什么 时 候 调 用 free。 

于 实 存 抉 的 方案 有 两 个 缺点 : TG A (S FE HAERE. HN TEAREN , 
如 果 某 个 对 象 分 配 到 错误 的 实在 块 中 ， 而 这 个 实在 块 在 程序 还 没 处 理 完 对 象 就 被 释放 了 ， 那 
么 程序 将 可 能 引用 未 分 配 的 在 储 单元 或 被 其 他 可 能 励 关 的 实在 块 重复 使 用 的 内 存单 元 、 同 样 
也 有 可 能 将 对 象 分 配 到 某 个 实 存 鼎 空 间 ， 而 没有 尽早 地 释放 ， 这 样 就 会 形成 一 个 存储 漏洞 
在 实际 应 用 中 ， 实 存 块 的 管理 是 很 容易 的 ， 这 些 问 题 都 很 少 发 生 ， 


6.1 #0 

















Arena 搂 口 指定 了 两 个 异常 以 及 管理 实 存 块 和 在 实 存 块 中 进行 内 存 分 配 的 函数 : 


(arena, hys 
#ifndef ARENA_INCLUDED 
#define ARENA INCLUDED 
#include "except.h" 
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#define T Arena_T 
typedef struct T *T; 


extern const Except T Arena NewFailed; 
extern const Except T Arena Failed; 


(exported functions 91) 


fundef T 
#endif 
SAF SRY QUERI HDR Saad F Iñi BUT] 26 (0: 


(exported functions 91)= 
extern T Arena_new (void); 
extern void Arena dispose(T *ap); 


Arena_new 创 建 一 个 新 的 实 存 块 ， 并 返回 一 个 指向 实 存 块 的 欧式 指针 ， DUEB TERRUG eA 
其 他 实 存 块 的 函数 。 如 果 Arena_new 不 能 分 配 实在 块 定 间 , 它 将 产生 异常 Arena_NewFailed , 
Arena_dispose 冬 放 与 菜 个 实 存 块 *ap 相 关 的 内 存单 元 ， 然 后 销毁 实 存 块 本 身 ， 并 清除 +ap。 如 
果 传 递 基 个 空 的 ap 或 *ap 给 Arena_dispose ， 会 发 牛 一 个 可 检查 的 运行 期 错误 : 

分 配 函 数 Arena_alloc 和 Arena_calloc 与 Mem 接 口中 同名 字 的 函数 类 似 ， 惟 -的 不 同 是 它 
们 是 在 实 存 块 空间 中 进行 分 配 的 。 


(exported functions 91)+= 
extern void *Arena_alloc (T arena, Jong nbytes, 
const char *file, int line); 
extern void *Arena_calloc(T arena, long count, 
long nbytes, const char *file, int line); 
extern void Arena free (T arena); 


Arena_alloc 在 arena 中 分 配 一 个 大 小 至 少 为 nbytes 的 任 储 块 ， 并 返回 一 个 指向 第 一 个 字 季 的 指 
针 。 人 存储 块 是 按 某 个 地 址 边界 对 放 的 ， 该 地 址 边界 即使 对 最 严格 的 对 齐 所 要 求 的 数据 也 是 合 
适 的 。 存 储 块 中 的 内 容 未 初始 化 。Arena_calloc 在 arena 分 配 一 个 存储 块 ， 其 天 小 足够 作 放 
count 个 元 素 的 数组 ， 每 个 元 素 的 大 小 为 nbytes ， 并 返 思 一 个 指向 第 一 个 字 节 的 指针 。 该 作 储 
欣 和 Arena_alloc 中 一 样 ， 会 调整 地 址 边界 ， 并 初始 化 为 0。 如 果 count 或 nbytes HAE EM. 会 
产生 个 可 检查 的 运行 期 错误 ， 
Arena_alloc 和 Arena_calloc 中 的 服 后 两 个 参数 是 调用 所 处 六 件 的 文件 名 和 行 号 。 如果 
Arena_alloc#lArena_calloc4\ RE Zh T RAY AER, WA Ce] SP Arena Failed E , 
并 将 fite 和 line (25 £t (EM IBExcept, raise, AHA FLAIR HI UTERE ASR file BLA os 
Fait, AGA ETERN Arena Failed 的 实现 中 给 出 错误 源 的 位 置 。 

Arena_free 释 放 arena 中 所 有 的 存储 单元 ， 即 释放 目 创 建 arena 或 上 一 次 对 其 调用 
Arena_free 开 始 ， 在 arena 中 分 配 的 所 有 单元 

在 该 接口 中 传递 完 的 T 到 任何 例 程 都 是 可 检查 的 运行 期 错误 。 该 接口 中 的 例 程 可 以 和 
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Mem 接 (1 中 的 例 程 以 及 其 他 基于 malloc 和 free 的 分 配 程 序 一 起 使 用 - 
6.2 实现 


(areng.cj= 
#include <stdlib.h> 
#include <string.h> 
*include "assert.h" 
#include "except.h" 
#include "arena.h" 
define T Arena T 


const Except T Arena NewFailed - 
{ "Arena Creation Failed" }; 

Const Except.T Arena Failed - 
{ "Arena Allocation Failed" }; 


(macros 98) 
(types 92) 
(data 96) 
(functions 93) 


HEER -AN PTAK i í chunk of memory ): 


(types 92)= 
struct T { 
T prev; 
char *avail; 
char *limit; 
1; 
prevy 字 段 指 癌 该 任 储 块 的 头 TATE BEER LAA F BU STE HUS T Moi limit FER 38 Ee 
KERT PRR: avail ER HE Ih OPES RAR PALE, avail 8 ƏJlimit > [s] 
是 可 以 分 配 的 ， 
"名 不 赵 迎 imitaval 时 ， 为 了 分 REN 个 字 节 的 在 铺 块 ,avail 将 增加 N , 并 返回 它 之 前 的 值 . 
如 果 太 超过 limit-avai ， 孝 么 调用 malloc 分 配 ARMER, arena fü W ë f €e Tg (F 8 
PR IAB. arena ZE qha tk T BORE GE STEM XR CP PU HATER 继续 进行 分 也- 
办 丝 实 在 块 结构 实际 中 一 个 存储 块 链 去， 该 链表 通过 和 位 个 存储 块头 部 的 实在 块 结构 副本 
中 的 prev 字 段 连接 起 来 的 。 图 6-1 显 全 了 某 个 实 存 块 的 状态 ， 其 中 已 经 分 配 了 :个 仓储 块 : 明 
影 部 分 总 已 分 配 的 空间 作 储 鼠 的 大 小 不 等 ， 如 果 分 配 的 空间 没完 全 十 满 存储 块 ， 邯 么 在 
储 块 的 尾部 也 可 能 是 未 分 配 的 空间 - 
Arena_new 分 配 半 返回 一 个 实 存 块 结构 ， 它 的 字段 被 设 为 空 指针 ， 表 明 足 个 详实 人 存 舌 ; 





(functions 93)= 
T Arena_new(void) { 
T arena = malloc(sizeof (*arena));. 
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if (arena == NULL) 

RAISE (Arena_NewFai led); 
arena->prev = NULL; 
arena-»limit = arena-»avail = NULL; 
return arena; 


























) 
le e Í prev 
| L. avail 
m limit 
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J L 
图 6-1 HATTARA ini 


Arena_dispose ji] Arena, free Sit Sc Té ERIN UT GRR: 然后 它 释放 实 存 块 结构 本 身 并 清除 指 
向 实在 块 的 指针 ; 


(functions 93)+= 
void Arena_dispose(T *ap) { 
assert(ap && *ap); 
Arena free(*ap); 
free(*ap); 
*ap = NULL; 
E 


Arena Himalloc Kifree f$ Mem, alloc KIMem free, [Nt I f& zr F Hb AE ERS > 
大 多 数 分 配 称 序 都 是 很 直接 的 ; 它们 将 所 需求 的 空间 大 小 向 上 将 整 为 合适 的 地 址 边界 ， 
将 ayail 指 外加 上 已 取 整 的 需求 空间 大 小 ， 并 返 轩 原来 的 仁 
(functions 93)+= 
void *Arena_alloc(T arena, long nbytes, 
const char “file, int line) { 


assert (arena); 
assert(nbytes > 0); 
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(round nbytes up to an alignment boundary 95) 

while (nbytes > arena->limit - arena-»avail) f 
(get a new chunk 95) 

} 

arena->avail += nbytes; 

return arena->avail - nbytes; 


} 
BLRMem HE PH ges arp k. 3080 


(types 92)4= 
union align { 
int i; 
Tong 1; 
Jong *1p; 
void *p; 
void (*fp)(void); 
float f; 
double d; 
Tong double 1d; 
HE 


的 大 小 给 出 了 主机 上 最 小 的 对 齐 边 界 调 整 。 它 的 字段 部 是 最 有 可 能 自 最 严格 地 址 边界 调整 要 
水 的 字段 ， 并 且 用 它 来 对 nbytes 向 上 取 整 : 
(round nbytes up to an alignment boundary 95)= 


nbytes = ((nbytes + sizeof (union align) - 1)/ 
(sizeof (union align)))*(sizeof (union align)); 


对 大 多 数 测 用 米 说 ，nbytes 总 是 小 于 arena->limit-arena->avail 的 ; 也 就 是 说 存储 块 至 少 
还 有 nbytes 的 空 亲 空间， 因此 上 曾 Arena_alloe 函 数 内 的 while 循 坏 的 主体 总 是 不 执行 的 。 如 果 
诸 求 不 能 在 当前 存储 快 中 得 到 满足 ， 那 么 就 必须 分 配 一 个 新 的 存储 块 。 这 造成 了 当前 存储 块 
尾部 空 鸭 袍 间 的 浪费 .如 图 6-1 中 链表 省 的 第 一 个 在 储 块 。 

分 配 -个 新 的 任 储 块 后 ，*arena 的 当前 从 保存 在 新 的 存储 抉 的 开头 ， 并 日 arena 的 字段 
已 被 初始 化 ,使 得 分 配 可 以 继续 : 


(get a new chunk 9s)= 
T ptr; 
char *Timit; 
(ptr e a new chunk 96) 
*ptr = *arena; 
arena->avail 
arena-»limit 
arena-»prev 


(char *)(Cunion header *)ptr + 1); 
limit; 
ptr; 


"onu 


(types 92}4= 
union header { 
struct T b; 
union align a; 
}; 
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结构 赋值 *ptr = *arenafll*arena f (£ 4E $i WTE 8836 AY TE I6 #b ， 共 用 体 header 保 证 arena->avail 
的 值 是 在 这 个 新 存储 专员 第 -次 分 配 时 进行 过 通 当 边界 调整 的 地 址 ， 

Mi KBs, Arena free TE pz 4b freechunks RJ XA BER TORE FULT SAR (ehh. DU 
TK LP BE FHmalloc WY REE. 3X PE & Rumi AE BE Hen wl asc (f De s prev F Ez bk HE OR HY, 
而 这 些 实在 块 结构 由 的 imit 字 堪 指 疝 紧 健在 储 块 末尾 的 下 地址。nfree 是 链 去 中 存储 块 的 数 
日 - Arena_alloc 从 沪 链 表 中 或 通过 调用 malloc 得 到 -个 实 闲 的 在 储 块 JEXI AR rie limits 
值 以 在 虐 面 的 <get a new chunk 95» fri 

(data 96)+= 


static T freechunks; 
static int nfree; 


(ptr e a new chunk 96}= 

if ((ptr = freechunks) != NULL) í 
Freechunks = freechunks-»prev; 
nfree--; 
limit = ptr-»limit; 

j eise { 
"ong m = sizeof (union header) + nbytes + 10*1024; 
ptr = malloc(m); 
if (ptr == NULL) 

(raise Arena, Failed 96) 

limit = (char *)ptr + m; 


1 


MI ARAB — FBTR ik. AB hi SF CER AE K. TT TES SH RY n 1: 
nbytes Z, FAA ALOK WAS AAS. Mmali, ARASH ALAM, HH 
Arena_alloc 将 触发 一 个 Arena_Failed 异常 : 

(raise Arena_Failed 96)= 


t 
if (file == NULL) 
RAISE(Arena Failed); 
else 


Except raise(&Arena Failed, file, line); 
了 


7 Harena ts (fd — 35 Atr REIR, Arena, allocil Mwhile fi FZ & bh HEIR 分 配 ， 它 仍然 有 
可 能 失败 : 如 凡 新 的 存储 坎 来 白 freechunks， 它 就 可 能 太 小 以 至 丁 不 能 满 是 需求 ， 这 BEN 
{FA TX UBwhile fs Se Mit isa) 9h PA 
Arena_calloc 仪 仅 测 用 Arena_alloc 即 可 . 


(functions 93)+= 


void “Arena_calloc(T arena, long count, long nbytes, 
const char *file, int line) { 
void *ptr; 


too hee ME 7 





assert(count » 0); . 
ptr = Arena alloc(arena, count*nbytes, file, line); 


memset(ptr, *\O', count*nbytes); 
return ptr; 


} 
SRA SRA ERIN, GEL AOA fk Dn IS DH (FB h E Pe BT. WARY 在 遍历 链表 的 时 
候 ， 也 把 *arena 恢 复 到 初始 状态 ; 


(functions 93)+= 
void Arena_free(T arena) { 
assert(arena); 
while (arena-»prev) { 
struct T tmp - *arena-»prev; 
(free the chunk described by arena 98) 
*arena = tmp; 


H 
assert(arena-»limit == NULL); 
assert(arena-»avail == NULL); 
H 
Stop 24 HELL, JU Harena->prev 指 网 的 实 存 块 结 梅 中 的 听 有 字段 复制 到 bmp 中 XAR 
语句 以 及 赋值 语句 *arena = tmp 相 当 于 Hi 存储 块 链 点 形成 的 实 存 块 结构 栈 的 “ 目 栈 操作 "。 97] 


Be Mie Rew PI Y. IA arena AYR AY BERE BW A, 
freechunks SA BFA a+} WS 25 PAY TERR k, DK EE BOR IU. BE AY KE JUS e DJ 
JE, URE EI BUS A ER TORT BE Qi IS] RE treechunks rd ñ) € AH MEE Hi4) BEREI Ey 
BUR EE AA EAR oe, PL TE A fon imalo ERRARE. YT Ron dR 
太 多 的 内 在 空 间 ，Arena_free 俩 得 在 freechunks 中 存储 不 起 过 
(macros 98)= 
#define THRESHOLD 10 
PRAE TATE HAR. - -lnfree 3%] (THRESHOLD . sh MEHAK ibd 调用 free 来 冬 放 : 
(free the chunk described by arena 98)= 
if (nfree < THRESHOLD) í 
arena->prev->prev = freechunks; 
freechunks = arena->prev; 
nfree++; 
freechunks->limit = arena-»limit; 


} else 
free(arena-»prev); 


图 6-2 中 ， 左 边 的 存储 块 是 需要 被 释放 的 。 当 ntree 小 JTHRESHOLDR[, fr fede MEHR ju 
Sifreechunk'h. FERES I TEAR WLR EE. TR Re SUE (GR A RTE njn) 38 
针 设 置 。 
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参考 目 浅 析 


某 于 实 存 块 的 分 配 程序 也 称 做 池 分 配 程序 (pool allocator )， 曾 被 多 次 介绍 过 
的 分 配 程序 (Hanson 1990 ) Bici EAX (elec ( Fraser 和 Hanson 1995 ) 中 使 用 而 开发 的 ， 
的 分 配 程序 比 实 存 块 的 分 配 程序 稍 简单 一 些 ; 它 的 场 是 静态 分 配 的， 并 用 亡 的 释放 程序 也 是 
调 十 free 完 成 的 。 在 它 最初 的 版 本 中 ， 分 配 是 通过 直接 处 至 实 存 块 结构 的 宏 指令 来 完成 的 ， 
FHA AA MAE Ri ffi al A H GR 

BarrettfüZorn (1993) Stok T BJ H Sy PETE MORSE eR. ME, 分 配点 的 执行 路 
径 是 很 好 的 可 用 米 预 测 在 该 位 置 分 配 的 存储 块 生存 期 的 ， 该 信息 包括 届 几 链 以 及 分 配点 
的 地 址 ， 可 以 利用 它们 来 选择 几 个 庶 用 程序 专用 实 存 块 空间 中 的 一 个 。 

Vmalloc(Vo 1996) 是 个 更 通用 的 分 配 程序 ， 可 以 用 米 实 现 Mem 和 Arena 接 口 。Vmailoc 多 
许 客户 调用 程序 将 内 存 组 织 到 一 个 区 域 中 ， 并 提供 了 管理 侍 个 区 域内 空间 的 函数 。Vmalloc 
库 函 数 包 括 一 个 malloc 接 口 的 实现 ， 访 实现 提供 了 Mem 搂 {T 的 校 验 实现 中 类 伏 的 内 存 检查 ， 
并 且 这 些 检 人 查 可 以 通过 设置 环境 安 量 来 控制 。 

基于 实在 块 的 分 配 程序 将 许多 总 式 释放 语句 讨 缩 成 -个 ,无 用 单元 收集 程序 ( Garbage 
collector) 更 进 了 一 步 : 它们 避免 了 所 有 的 总 民 释 放 。 在 使 用 读 用 单元 收集 程序 的 程序 设计 
语音 中 ， 程 序 员 几乎 可 以 忽略 存储 单元 的 分 配 ， 目 存储 分 所 错误 也 不 可 能 发 生 ， 这 种 策略 的 
优点 怎么 讲 都 不 夸张 。 

使 用 无 用 单元 收集 程序 ， 空 间 的 回收 是 在 党 要 的 时 候 自动 守成， 通常 是 在 分 配 要 求 不 能 
满足 的 时 候 自动 完成 。 无 用 单元 收集 程序 能 找到 称 序 变量 所 引用 的 所 有 存储 块 ， 以 及 由 存储 
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块 中 的 字段 引用 的 所 有 存储 抉 等 等 。 这 些 部 足 可 以 访问 的 存 铺 央 , 而 剩 下 的 都 足 不 可 访问 的 ， 
并 有 卫 可 以 再 使 用 。 关 于 无 用 单 苞 收 集 程序 有 大 其 的 文献 ; Appel(1991) 足 个 简短 的 综述 ， 强 
38 6 EGRE AYES; fiKnuth(1973a)iCohen (19810 BYE ATER II — SAE. 

Jr HEURE Ur PIB (iti. A £ MCA ñu BE Fr o TCI UB EAE AE DL Her Bg 08 
ety Edit a fiu edid. ope Ie ERU HE wR A RUY TB AD. Ili PE M 
常用 来 提供 必要 的 信息 ， 例如 LISP ，lcon 、SmallTalk 、MEL 以 及 Modula-3， 保 留 收集 器 
(Boehm fi Weiser 1988) A] VL 4b BUT AEH UL AE 9828 A er e PERE REIT RAY. (RC 和 C++ ,他 们 
提出 了 -个 类 似 于 指针 的 适 点 于 任何 边界 调整 的 位 模式 FORCE F 355F. HE my 
作 储 块 是 可 访问 的 。 因 此 保 阴 收集 器 会 把 - 些 木 可 访问 的 存储 块 也 当 作 旦 可 访问 ， 这 使 得 它 
经 常 处 于 繁忙 状态 .但 是 没有 别 的 选择 ， 愉 能 尽 基 将 是 访问 的 在 储 块 集合 估算 得 很 大 。 尽管 
保留 收集 器 有 这 个 明显 的 缺点 ， 供 是 它 在 某 些 程序 (Zorn 1993 ) 中 仍然 工作 得 相当 好 ` 








练习 


6.1 Arena alloc H 2648 Hiarema fi E AY efe Ee Ym Ma HU CEA Be hit A Be 9800 os Ds 
Ved, BIRER PEE HO (€ die h A ALS AY =n. EP -个 新 的 存储 下 、 修改 
Arena_alloc 使 和 有 茶 个 在 储 块 有 足够 的 空间 的 情况 、 分 凤 已 存在 的 存储 块 中 的 
空间 ， 并 度量 一 下 这 样 做 有 什么 好 处 。 你 是 否 能 找到 -个 应 月 程序 、 它 的 内 在 使 用 
暴 由 于 这 样 的 修改 而 得 到 明 蜡 减少 ? 








6.2 当 Arena_alloc 尖 要 一 个 新 的 存储 蕊 时 ， 如 果 名 JUR rst US EA EE E de e 
BOB BRETT TAL, J — Ph M Day FE IS ARE JR dd Acts D Fe RES. dnd 





freechunks 中 没有 合 运 的 存储 块 ， 孝 么 分 配 -个 新 的 仓储 块 。 记录 freechunks 中 最 
大 的 存储 块 可 以 避免 无 意义 的 访 历 ， 如果 这 么 做 ， Arena_alloc 中 的 while 循 环 就 可 
以 用 这 语句 来 代 枕 ， 实 现 这 种 方案 并 度量 此 性能。 E A Arena allocíflii frs 
EH BEKR? CERU ER ZUE HA Ze 

63 THRESHOLD i B10, ERE RHE SEE KERAN ME LOOK FAH 的 
内 存 空 问 ， 因 为 Arena_ailoc 分 本 的 存储 块 爹 少 为 1OK 字 节 、 为 Arenpa_allec 和 
Arena_free 设 计 - -种 方法 米 监测 分 本 和 释放 的 模式 . 并 根据 这 些 模 式 动态 地 计算 
THRESHOLD. 这样 做 的 日 的 足 使 得 襟 闲 站 储 块 链 志 尽 可 能 地 小 ， 并 是 济 用 malloe 
的 次 数 最 少 。 

6.4 解释 为 什么 Arena 接 口 不 支持 函数 


void *Arena resize(void **ptr, long nbytes, 
const char *file, int line) 


a ffMem, resize— fE. Vc eli Al VL Kepir B JS PJ 0042 fk t je Ambytes TEH., 
JE VI = TEILE BC II ERE D STE. Vere aB i] GE Li edil eh Ia] 
-个 实 存 块 空间 中 《 候 不 AB Sh. 就 像 ptr 指 定 的 在 储 块 - 样 。 你 如 何 
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6.5 


6.6 


$B SE BD LACES XX RRR? 你 修改 的 实现 中 有 什么 可 检查 的 运行 期 铺 误 ? 

在 堆栈 分 配 程 序 中 ， 一 个 分 配 操作 将 新 的 内 存 空间 正和 人 给 定 堆栈 的 栈 顶 ， 并 返回 其 
第 一 个 字 节 的 地 址 。 标 记 堆栈 返回 的 该 栈 当 前 高 度 的 编码 作 ， 而 释放 将 使 堆栈 的 栈 
项 元 素 推 册 ,使 境 厂 返回 到 之 前 被 标记 的 高 度 。 为 堆栈 分 记 程 序 设 计 并 实现 … 个 接 
E, 你 能 给 出 哪些 可 检查 的 运行 期 错误 来 本 获 空间 释放 的 错 谋 ? 举例 说明 这 类 错误 ， 
如 灵 放 高 于 当前 堆栈 栈 项 的 空间 , 或 释放 某 个 已 经 被 释放 、 而 后 米 义 被 重新 分 配 了 
的 空间 。 

和 如果 程序 中 有 不 止 一 个 内 存 分 配 接 门 ， 就 会 血 临 这 样 一 个 问题 ， 在 这 些 接口 之 阅 做 
出 选择 ; 但 是 对 一 个 特定 的 庶 州 程序 来 说， 你 可 能 并 不 知道 哪个 接口 是 起 好 的 。 设 
计 并 实现 -个 单一 的 接口 ， 它 支持 两 种 分 配 程 序 。 例 如 该 接口 可 能 提供 像 
Mem_alloc 的 分 配 函 数 ， 但 是 “分 配 环境 ”中 的 操作 可 以 用 其 他 函数 米 疏 慨 、 该 坏 
境 可 以 指定 内 存 管理 的 纲 攻 ， 例 如 使 用 的 是 什么 分 配 穆 序 ， 如 果 使 用 的 是 基于 实在 
块 的 分 配 ， 也 辣 以 指定 使 用 的 是 哪个 实在 块 空间 。 其 他 也 数 也 可 以 将 当前 环境 压 信 
内 部 栈 中 ， 然 后 建立 一 个 新 的 环境 ， 最 后 进行 出 栈 操 作 以 恢复 原来 的 环境 . 在 你 的 
设计 中 调研 这 些 以 及 兵 他 方法 。 





第 7 章 d R 


链表 是 出 零 个 或 多 个 指针 经 成 的 序列 ， 堆 个 指针 的 链 赤 是 空 链 去 ， 链 表 中 指针 的 数 日 总 
是 链表 的 长 度 。 几 乎 所 有 的 非常 规 应 用 程序 都 以 某 种 形式 使 用 了 链表 。 止 是 山 于 链表 存 程序 
中 如 此 普及 ， 所 以 -… 些 程序 设计 语言 把 它们 作为 内 幅 类 型 、 像 LISP 、Scheme IML f RE 
名 的 例子 。 

链表 很 容易 实现 ， 四 此 程序 员 通 常 对 每 个 正在 开发 的 应 用 程序 进行 实现 ， 心 管 大 多 
数 为 应 用 程序 专门 设计 的 链表 接口 都 有 很 多 的 相似 之 处 , 但 还 是 没有 被 广泛 接受 的 标准 接口， 
以 下 昌 说 明 的 抽象 数据 类 塌 List 提 供 了 许多 特定 应 用 设计 的 接站 都 会 实 坝 的 功能 ， 第 11 ae p 
描述 的 序列 是 链表 的 另 一 种 表 朱 方法 。 





7.1 #0 


完整 的 List 接 口 代码 为 : 


(list. y= 
#ifndef LIST INCLUDED 
#define LIST INCLUDED 


#define T List T 
typedef struct T *T; 


struct T { 
T rest; 
void *first; 

i 
extern T List append (T list, T tail); 
axtern T List_copy (T list); 
extern T List_list (void wx, ...); 
extern T list pop (T list, void **x); 
extern T List push (T list, void *x); 
extern T List reverse(T list); 


extern int List length (T list); 
extern void — List free (T *list); 
extern void — List map (T list, 
void apply(void **x, void *c1), void *cl); 
extern void **List toArray(T list, void *end); 


#undef T 
#endif 
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List, TÆ— AH Lin TZ iy AME TF. K E SRADT MMS + (71 8928 ARMY. N 
List 则 丢 示 了 这 些 网 节 ， 办 为 对 这 个 特殊 的 ADT . Batu 26 5 B TPS 05 del E IR B EIE E 
做 能 带 来 的 好 处 。 

List_T 的 胡 示 形式 非常 相似 、 很 难 想像 会 在 在 许多 其 他 的 表示 ， 它 们 的 实现 可 以 据 供 足 
够 重要 的 优点 来 证 明和 隐藏 链 表 元 素 是 个 出 欧 个 字段 组 成 的 结构 体 这 -事实 尽 值 得 的 。 本 
章 的 练习 中 讨论 了 其 中 的 一 些 表示 方法 。 

展现 List_T 的 表示 可 以 简化 接口 以 及 它 的 几 种 使 用 方式 例如 List_T 类 型 的 当量 可 以 静 
态 地 定义 和 初始 化 ， 这 对 在 编译 阶段 构建 链表 很 有 用 、 可 以 流 免 分 配 拘 作 ， 男 外 ， 也 厅 以 在 
其 他 的 结构 中 洋人 List_T 结 构 。 个 空 的 List_T 就 是 一 个 容 的 链表 ， 这 也 是 空 表 最 自然 的 表 
不 ， 并 且 函 数 也 不 需要 访问 first 和 rest 字 段 ， 

接口 中 的 所 有 例 程 都 可 以 接收 -个 守 T 作 为 链 友 参数， 并 将 它 解释 成 空 的 链表 

Tist-list 创 建 苍 返回 一个 链表 。 它 随 V 个 非 空 指针 加 -个 空 指针 一 起 调 用 ， 创 建 一 个 有 N 
个 节点 的 链表 ， 这 AN 个 节点 的 first 字 段 在 有 这 N 个 非 空 指 针 ， 而 它们 的 rest 字 段 为 宣 。 例 如 ， 
赋值 语句 : 

List_T pl, p2; 


pl = List_list(NULL); 
p2 List list("Atom", "Mem", "Arena", "List", NULL); 


JEWS HERA CEASA ERR “Atom”, “Mem”, “Arena” $ “List” 的 
节点 的 链表 : List list el fe j^^: S- f Mem, Failed. 

List list fix pt 838 fit ARS uj E BO) Ho nU SERE ES DO. TRE ULL E P I 
式 转 换 的 原型 、 因 此 程序 员 必 须 在 传递 其 他 不 同 十 字符 和 空 指针 的 参数 作为 第 个 或 后 面 的 
参数 时 进行 类 型 转换 。 例如， 为 了 构建 一 个 有 4 个 单 -TENER IEE FRR “Atom”, 
“Mem”, "Arena" Al "List", sah fia HUB 








p = List Jist(List list("Atom", NULL), 
(void *)List_list("Mem", NULL), 
(void *)List list("Arena", NULL), 
(void *)List list("List", NULL), NULL); 
如 果 忽 略 在 这 个 例子 中 所 不 的 转换 将 会 导致 下 可 检查 的 运行 期 错误 ， BOP 0056 8 Et SEA KE 
参数 链表 的 缺点 之 - 
List_push(T list,void *x) 在 list 的 表 头 洪 加 一 个 新 的 他 点 ， 存 储 x ， 并 返 同 新 的 链表 ， 
TistLpnsh 林 能 会 广 牛 异常 Mem_Failed ，List_pusb 是 男 外 一 种 构建 新 的 链表 的 方法 ， 例 如 证 何 : 







p2 = List_push(NULL, "List"); 
p2 = List_push(p2, "Arena"); 
p2 = List_push(p2, "Mem"); 

p2 = List_push(p2, "Atom"); 


I T's ETA EZ, 
HOE— "EAE SEE. List. pop(T list,void xxx) 将 链表 第 一 个 节点 的 first 字 段 赋值 给 xx ， 


# 下 7 





RIX BRAS. USA RRR RON. TR BU ROGER MRE RUE PER 
HB List_pop {LRA RER, SP HAA Aol PEE 


List append(T list,T tai) fe. -4- BATA MER. 它 将 tail 赋 值 给 list 链 表 的 最 后 - 


个 节点 的 rest 字 段 。 如 果 list 为 党 ， 它 返回 ta Attia: 

p2 = Li$t_append(p2, List list("Except", NULL)); 
将 P2 赋 值 为 5 个 元 素 的 链表 ， 这 个 5 个 蕊 素 的 链表 足 通过 向 前 面 创建 的 4 个 元 素 的 途 表 中 添加 
一 个 并 有 BExcept 拒 素 的 链表 形成 的 - 

List_reyerse 友 转 了 它 链 去 参数 由 WARRT HR 





结果 链表 - 例如 : 

p2 = List.reverse(p2); 
返回 AfA “Except”, “List”. "Arena", “Mem” A “Atom” BUE X. 

芭 日 前 为 止 措 述 的 大 部 分 例 程 部 具有 破坏 性 (destructive ) uk 4E 3& F] YE ( nonapplicative ); 
它们 可 以 必 灾 传递 给 它们 的 链表 并 返回 结果 链表 、List.copy 是 个 适用 (applicative ) 的 着 
数 ， 它 复制 它 的 参数 ， 并 返 册 复制 结 呆 。 All, ATTEN: 

List T p3 = List_reverse(List_copy(p2)); 
p3 是 一 个 “Atom",， "Mem", "Arena", “List” Al "Except" (fd; p2 没 有 改变 。 
List copy 可 能 会 产生 异常 Mem_Failed 。 

List_leng 也 返回 其 参数 链表 中 的 节点 数 。 

List_free 搁 收 一 个 指 问 某 个 T 的 指针 为 参数 。 如 果 xlist 不 为 实 ， 那 么 List_free 释 放 *list 中 
所 有 的 节点 ， 并 把 *iist 设 为 空 。 如 果 *list 为 衬 ， 那 么 List_free 将 不 做 任何 操作 ， 如 果 传 递 
个 空 指针 给 两 数 List_free ， 将 产生 可 检查 的 运行 期 错误 ， 

List_map 对 list 中 的 每 个 节点 湖 用 apply 所 指向 的 沼 数 。 客户 调用 程序 可 以 传递 某 个 应 用 
程序 专用 的 指针 c1 给 List_map， 并 也 该 指针 也 传 给 xapply ， 作 为 其 第 一 个 参数 。 对 list 中 的 
每 个 节点 ，*apply 连 带 -- 个 指向 节点 的 first 字 段 的 指针 和 cl 指针 一 起 被 泣 用 ， 因 为 xapply E 
和 指 癌 first 字 自 的 指针 一 起 被 调用 的 ， 所 以 它 可 以 改变 first 字 段 的 值 ， 总 的 来 说 ，apply 和 cf 
被 称 为 一 个 闲 包 (closure ) REY (callback ); 它们 一 起 规定 了 一 个 操作 ， 以 及 该 操 作 的 
些 上 下 文 专 几 的 数据 。 例 如 ， 给 定 函 数 mkatom ， 

void mkatom(void , void *c1) í 


Bey 
char **str = (char **)x; 
FILE *fp = cl; 


*str = Atom string(*str); 
fprintf(fp, "XsXn", *str); 
} 
而 调用 List_map(p3,mkatom,stderr) 用 等 效 的 原子 节点 代替 了 p3 中 的 宁 符 中 ， 并 在 错误 输出 窗 
山中 输出 结果 : 
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[加 


Atom 
Mem 
Arena 
List 
Except 
男 一 个 例子 总 函数 applyFree: 
void applyFree(void **ptr, void *cl) í 
FREE(*ptr) ; 
了 


该 西数 用 来 在 链表 本 身 被 释放 之 前 ， 释 放 上 由 链表 中 的 first 字 段 所 指向 的 空间 。 例如， 
List_T names; 
List_map (names, applyFree, NULL); 
List_free(&names) ; 
释放 了 链表 names 中 的 数据 ， 然 后 释放 节点 本 身 ， 如 果 apply 改 实 了 list、 这 将 是 :个 不 可 愉 


给 定 一 -个 有 入 个 什 的 链表 ，List_toArray(T List.void *end) 创 建 -个 数组 ， 它 的 元 素 0 到 N-1 分 别 
存储 链表 中 first 字 段 中 的 N 个 值 ， 击 第 N 个 元 业 存 储 值 snd， 值 znd 通常 是 一 个 空 指针 。List_toAray 
返回 一 个 指向 该 数组 第 一 个 元 素 的 指针 :例如 3 中 的 元 素 可 以 以 排 好 的 顺序 打印 出 来 : 

int i; 

char **array = (char **)List toArray(p3, NULL); 

qsort((void *")array, List length(p3), sizeof (*array), 

Cint (*)(const void *, const void *))compare); 
for Ci = 0; array[i]; i++) 

printf("%sNn", array{i]); 
FREE (array) ; 


就 如 这 个 例子 所 示 的 一 样 ， 客 户 调用 程序 必须 释放 出 List_toArray 返 回 的 数组 。 如 果 链 表 为 
空 ， 那么 List_toArray 返 回 一 个 元 素 的 数组 。List_toArray 也 可 能 产生 异常 Mem_Failed， 
compare 以 及 它 和 标准 库 明 数 qsort 的 使 用 在 8.2 节 中 给 出 。 


7.2 实现 


{hist.c= 
#include <stdarg.h> 
#include <stddef.h> 
#include "assert.h" 
#include "mem.h" 
#include "list.h" 


#define T List_T 


(functions 108) 
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List push Liste UP ig S809 BM. 它 分 配 一 个 节点 、 初 始 化 ， 然 后 返回 一 个 指向 它 
的 指针 : 


(functions 108)= 
T List.push(T list, void *x) { 


T p; 

NEW(p); 

p->first = x; 
p->rest = list; 
return p; 


t 
其 他 创建 链表 的 函数 : 如 List_list ， 稍 复杂 一 些 . Ae Wo eT AR, HO 
须 为 每 个 非 窜 的 指针 参数 添加 一 个 新 的 节点 到 正在 变化 的 链表 中 为 了 做 到 这 些 ， 它 使 用 了 
一 个 指针 ， 它 所 指向 的 指针 指向 新 的 节点 由 应 该 被 巍 过 值 ， 


(functions 108)+= 
T Listllist(void *x, ...) { 
va list ap; 
T list, *p = &list; 


va_start(ap, x); 
for ( ; x; x = va_arg(ap, void *)) í 
NEW(*p); 
(*p)->first = x; 
p = &(*p)->rest; 
i 
*p = NULL; 
va end(ap); 
return list; 


} 
P 开 始 指向 list， 因 此 指向 第 一 个 节点 的 指针 被 赋 位 给 list、 此 后 ,，p 指 向 链表 中 最 后 ~- 个 节点 
的 rest 和 字段， 因此 ， 对 *p 的 赋值 就 向 链表 中 沃 加 了 一 个 站 点 。 下面 的 周 显 上 了 p 的 刘 始 化 的 
效果 以 及 当 List_list 构 造 了 一 个 有 三 个 委 点 的 链表 时 ，for 特 环 体 中 的 滞 休 对 p 的 效果 。 
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RE A F — PARTUR TENAX, ETA PRS AN RL. adi 


£F as SE ARX 15 3 0 HE. i1 23 ARE ARF CList_list(NULL) ik FIM E— E EA. Bl— + 
空 指针 - 

List_list 使 用 了 指向 指针 的 指针 ;List_T *s. 这 是 许多 链表 操作 算法 的 典型 用 法 . 
了 -种 简 妥 的 杭 制 来 处 理 可 能 为 空 的 链表 中 的 初始 节点 ， 以 及 -不 韭 空 链 去 的 内 部 节点 - 
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LisLappend 说 明 fix PARA a - hie fil: 
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(functions 1084 
T List.append(T list, T tail) í 
T *p = &list; 


while (*p) 
= &(*p)->rest: 
*p = tail; 


return list; 


1 


List_append 中 的 指针 p 一 直 沿 着 list 前 进 ， 直 到 它 指 向 一 个 list 术 端的 空 指针 tail AER GEE 
值 为 冠 指针。 如 出 ist 本 身 就 是 窜 指 针 ， 闭 么 p 在 指向 list 的 时 后 就 结 来 ,这 正 是 添加 tail 公 
一 个 空 链表 所 希望 达到 的 效果 - 


List_copy 足 List 接 口中 最 后 个 使 用 指向 指针 的 指针 的 习 殿 用 法 的 函数 : 


(functions 108) 
T List_copy(T list) í 
T head, *p = &head; 


for C ; list; list = list-»rest) í 
NEW(*p); 
(*p}->first = list->first; 
= &(*p)->rest; 
} 
= NULL; 
return head; 


} 


指向 指针 的 指针 并 不 能 简化 List_pop 或 List_reverse , 
实现 就 已 经 足够 了 。 List_pop MM BRE ABET HOE 
AUB F| 一 个 空 的 链表 ， 


办 此 对 这 两 个 蝎 数 ,也许 用 更 明 必 的 
AS d 


个 节点 ， 并 返回 删除 后 新 的 链表 ， 或 仅 





(functions 108)+= 
T List pop(T list, void **x) { 
if (list) { 
T head = list-»rest; 
if GO 
*x = list-»first; 
FREEClHist); 
return head; 


# A 8l 





} else 
return list; 


} 
如 果 x 非 空 ， 蓝 么 *x 在 链 素 中 第 一 个 节点 被 删除 之 前 ， 被 国 俱 为 沪 节 点 的 first 字 段 。 注意: 
List_pop 必 须 在 届 除 list 指 向 的 节点 之 前 保存 list->rest、 
List_reverse 有 两 个 指针 沿 善 链表 前 进 ，list 和 next， 并 在 前 进 时 使 用 这 两 个 指针 逆 和 转 链 
K; new 总 是 指 问 已 道 转 的 链表 的 第 一 个 接点 ; 





(functions 108)+= 
T List_reverse(T list) í 
T head = NULL, next; 


for ( ; list; list = next) í 
next = list-»rest; 
list->rest = head; 
head = list; 

了 

return head; 


} 
下 面 的 图 说 明了 每 次 循环 选 代 ， 在 循 坏 体 第 -个 语 名 执行 之 后 的 状态 :对 next 的 赋值 ， 针 对 
的 是 链表 中 的 第 三 个 元 素 。 
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next 指 向 list 的 后 继 ， 当 list 指 向 最 后 一 个 节点 时 、hext 指 向 空 值 ， 而 head 指 向 己 道 转 的 链表 . 
它 开始 指向 list 的 前 驱 ; 当 list 指 向 第 -个 节点 时 ，head 指 癌 空 值 。 循 环 休 中 的 第 二 个 或 第 一 
个 语句 将 由 list 指 向 的 节点 挂 接 到 head 链 表 的 表 头 ， 而 递增 去 达 式 list = next 把 list 向 它 的 后 继 
推进 .其 后 链表 的 指针 如 下 BIR 
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下 一 次 通过 循环 体 时 ，next 将 入 次 前 进 。 
List_length 遍 历 list 链 表 ， 对 它 的 入 点 进行 计数 ， 而 List_free 这 访 list 链 表 ， 释 放 其 得 个 节点 : 
(functions 108)+= 


int List_length(T list) í 
int n; 


for (n = 0; list; list = list->rest) 
ne; 
return n; 
了 


void List_free(T *list) { 
T next; 


assert(list); 

for ( ; *list; *list - next) f 
next = (*list)-»rest; 
FREE(*list); 


} 
List map ERREZ, AERAR, Du DH PRU OL ER I Bot T fe 
List map FUE E listek, SE HTIS IR Sih 38 S RUTirSUT EE MAE TELA RUE P BUR BUT GUB 0 
指针 c1 来 站 出 闭 也 两 数 : 





(functions 108)+= 
void List map(T list, 
void apply(void **x, void *cl), void *cl) { 
assert(apply); 
for ( ; Vist; list = list->rest) 
apply(&list-»first, c1); 
i 


List. toArray 4H BÀ —4- TIN AT ERU BCH HAR AEN 46 bt de Ht, epu REA ET a 
制 到 数组 中 : 


(functions 108)+= 
void **List toArray(T list, void *end) í 
int i, n = List length(list); 
void **array = ALLOC((n + 1)*sizeof (*array)); 


for G = 0; i < n; i++) € 
array[i] = list->first; 
list = list->rest; 

array[i] = end; 

return array; 


} 
ARTERIE DL ñ — TOCEMPEREDE eA CU SEL 是 使 得 List_toArray 


tE 
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E Ba VAG ME dB P] RR B AE 25 E TE. Hik Pr js JR Be Be AS TR PEE I A 08 


指针 . 


参考 书目 浅 析 


Knuth ( 1973a ) 描述 了 所 有 的 处 坦 单 供 表 的 重要 算法 类似 于 List 接 [1 提供 的 这 些 算法 ， 
以 及 由 Ring 提 供 的 处 理 双 链表 的 所 有 重要 的 算法 ( 第 12 章 由 给 出 了 说 明 )， 

在 诸如 LISP 利 Scheme 的 链表 处 理 语言 以 及 诸如 ML (Ullman 1994 ) (ty 698 y PAIE 
用 了 链表 -Abelson 和 Sussman (1985) ERE Ub SEKE WHT plc Hok EEL fo) BY 
教材 小 的 一 本 ， 它 使 用 的 语言 足 Scheme - 


练习 


7.1 


7.2 
7.3 
7.4 





au 


HET BERADT,. [REX AAR AARE HIS EDR dos zig. BEHA 

ADT 的 接口 ,然后 完成 “个 实现 、 其 中 一 种 方法 是 没 List_T 昆 一 个 隐 式 指针 ， 指 向 

茶 个 链表 的 该 表 头 保 企 一 个 指向 链表 本 条 的 指针 或 者 个 同 叶 指 向 链表 中 第 

一 个 元素 和 最 后 一 个 元 泰 的 指针 ， 欠 表 的 表 头 也 才能 在 有 匆 表 的 : : E, 

75 List_list, List appendfüList copy. AKIE HH& IUE 的 指针 

使 用 指向 指针 的 指针 重 写 List_reverse 

List-append 是 - 个 存 许多 应 用 程序 中 使 用 典 率 最 高 的 链表 操作 ， 它 儿 须 遍 启 到 链 
RHA, RUINAT RMA, LAE RRID SON), MA GERE RN E RA 
A HRR. Memi gi KAARS RRN M LI IE E 

MRE RIT hapa 一 个 节点 的 Test HIS -个 接点 ， 而 链 才 本 身 出 个 指向 最 后 
-个 节 铝 的 指针 表示 。 央 此 ,在 常数 时 间 内 典 可 以 到 第 -个 节点 了 可 以 访问 到 
















”大 后 一 个 节点 ， 并 用 梁 加 个 节点 到 循环 链表 也 可 以 在 常数 时 间 内 完成 ”设计 一 个 


链 麦 ADT 的 接口 使 用 循环 链接 才 ， 州 隐 





或 显 式 表示 的 接口 来 做 实验 。 


mua 
{113 








第 8 章 R B 


一 个 关联 表格 《associative table ) E- -个 关键 字 - 值 对 的 集合 。 它 很 像 呈 数组， 惟 一 的 
不 同 是 它 的 让 标 可 以 旦 任何 类 型 的 值 . 在 许多 应 用 程序 中 部 使 用 了 表格 - 例如 编译 器 就 保 在 
HGR, AES NAS RRB A F 一 组 属性 . ETRE TET PR, 
VE AL RR ESA O X: KAS ORG APPIO YB RAEN RAK Ja ul: 例 
Al, Rul IRE Re. RA REFE ATR THT T: 索引 的 每 个 区 段 一 个 关键 字 
一 一 而 关键 学 的 值 是 另外 的 表格 ， 共 关键 字 是 索引 项 本 Se B, HAB RTA R. 

表格 有 很 多 种 使 用 方法 ， 如 果 给 舟 种 使 用 举 -个 例子 可 能 得 花 去 一 些 齐 的 笔墨 Table 
接站 就 中 为 了 能 够 在 这 许多 的 用 法 中 被 使 用 而 设计 的 。 它 保存 有 关 包 宁 - 值 对 ， 但 是 它 从 来 
不 从 但 关键 字 本 身 ; 只 有 客户 调用 程序 通过 传递 给 Table 中 的 例 程 的 旺 效 来 检查 关键 字 : 8.2 
节 中 给 出 了 一 个 典型 的 Table 客 户 调 用 程序 ,一 个 将 具 输 入 中 出 现 的 单 闻 数 日 打印 出 来 的 程 
序 。 该 程序 wf 同时 也 使 用 了 Atom 入 Mem 接 口 ， 
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Table 接 口 用 隐 式 指针 类 型 来 表示 一 个 关联 胡 格 : 


(table. hy= 
#ifndef TABLE_INCLUDED 
#define TABLE_INCLUDED {115 


#define T Table_T 
typedef struct T *T; 


{exported functions 116) 


#undef T 
#endif 
TE RA Table_ Te tT fic ME, MER h MICI EES HX ET- DUE ER iD 
问 关 键 字 - 值 对 。 如 果 把 - eos Table TRA HA EE Fe E AAT PEA AK, MT 
生 可 检查 的 运行 期 错误 。 
Table_T 吓 通过 以 下 函数 来 进行 分 配 和 回收 的 ; 
{exported functions 116)= 
extern T Table_new Cint hint, 
int cmp(const void *x, const void *y), 


unsigned hash(const void *key)); 
extern void Table free(T *table); 


36 gs* 





Table_new 的 第 —4 S fthin zx Si de t RES TERR i se Pi BB fA iT. 不 管 hint 的 值 是 多 少 . 
fr 09 368 alba] PL Ce BRE BR EL icm. LL Ab aa Rhine) (E fée Bü, dT AT RE 2 E ESTE 
， 如 染 hint 的 入 为 负数 ,也 会 产生 可 检查 的 运行 期 错误 。 隐 数 cmp 和 hash 处 理 客户 湖 用 程 
TEEN Ree 给 定 两 个 关键 字 x 和 y 、 cmp(x,y) 必 须 返 问 -4 pO. POR A FO OE E, 
AY SIAR dec] Py. xy KR Ty. 标准 的 库 晴 数 stremp 遍 是 一 个 以 字符 捉 为 关键 字 的 比较 
ARPIT- Ma RARO El- -个 key AUR SUA ; i empGcv)E HO. #34 hash(x) 2538 28 
-Phash(y). +S de MU AÈ A cili hashuemp R$. 
ECT: Wk EC ORE, PQ ao thash k de ssl BRIE. URS BOE ha eRe T 
RATE BC. ATable #30 SLB ET - 4 iñ hash 函数 。 同样 地 ， 如 果 emp 是 一 个 空 的 函 
BUR Eb, BEA 关键 字 CHE Cf. BUR sy. RES HESS ， 





Table. new KER: 一 个 大 小 提示 、 一 个 hash 丽 数 以 及 -个 比较 函数 ， 提 供 的 信息 比 大 
[is] 多 数 实 现 所 需要 的 更 多 。 例如， 在 8.3 节 中 描述 的 散 列 表 的 实现 ， 它 需要 一 个 比较 函数 ， 只 
用 来 测试 相等 与 奉 ， 而 使 用 树 的 实现 就 并 不 需 费 大 小 扣 示 或 hash 函数 .这 种 复杂 性 就 是 一 个 
允许 多 种 实现 的 设计 的 代价 ， 侧 这 出 是 设计 好 的 接口 很 砍 的 原因 之 -。 
Table. free Fe it*table, HECA He E. hp Rtableak*table Wy 4, Ww ET MA 6038 I; 
MR, Table free JER Pit KE RUA, CM Table map 中 被 释放 。 
PER: 
(exported functions 1169 
extern int Table length(T table); 
extern void *Table put (T table, const void *key, 
void *value): 


extern void *Table get (T table, const void *key); 
extern void *Table remove(T table, const void *key); 


BE RH OBP E.R SAY KEE a S CH TER E ES- BG BS 、 
BUR 55 3t ESE RRK ALL, AA BR I et SE xA] 

Table._jength 返 回 在 table 中 关键 字 - 值 对 的 数 日 . 

Table. put ifs jf- 4-!hkey 和 value 给 定 的 关键 字 -他 对唱 tabled - fn Stable (3 £f Akey , 
AS 4 Fivalue E H ARRIE, 3E FLTable, put; fic šJ AJ (lj. FPO, key 和 value 的 值 被 添加 到 
tablte 中 ， 表 格 的 记录 项 数 加 1， 并 了 Table_put 返 回 - NE HEE. Table putt] fë P= £k scat 
Mem, Failed , 

MM WA ISI. IRI LUE 关键 字 关 联 的 值 rS table As 
f PME, Table geti masii FLA, Mn Btable 7 Sak £t 2: 181 IHR. IB ZUR F| 
"Eel oat, 
Table removet fetable rh AER CHR key ， 如 果 找 到 ， 就 从 表格 中 删除 该 关键 字 - 值 对 . 
央 比 表格 的 记 肌 项 数 减 1、 并 六 返回 被 币 除 的 值 ， 如 果 table 不 存在 关键 宁 key ， 姥 和 
Table_remove 对 table 不 做 任何 操作 ， 并 返回 空 指针 。 
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PAH : 
(exported functions 116)+= 
extern void Table map (T table, 
void apply(const void *key, void **value, void *cl) 
void *c1); 


extern void **Table toArray(T table, void *end) 
访问 关键 字 - 值 对 并 把 它们 收集 到 一 个 数组 中 。Table_map 以 不 诡 定 的 次 序 对 table 小 的 每 个 关 
键 字 - 值 对 调用 apply 指 向 的 涛 数 。apply 和 c1 指 定 了 -个 亲 包 : 客户 测 几 程序 可 以 传递 个 应 
用 程序 专 几 的 指针 c1 给 Table_map ， 并 屿 这 个 指针 在 每 次 测 用 时 义 传递 给 apply ”对 table 中 的 
街 个 关键 字 - 值 对 ，apply 是 同 它 的 关键 字 、 指 向 它 的 值 的 指针 以 及 cl -起 调用 。 内 为 apply 4 
同 指向 它 的 值 的 指针 起 调用 的 ， 因 此 ， 它 可 以 改变 它 的 值 。Table_map 同 时 也 可 以 在 释放 
表格 之 前 用 米 释 放 关 键 宇 或 从 。 例 如 ， 假 设 关键 字 足 诛 ， 前 数 


static void vfree(const void *key, void **value, 





void *c1) í 
FREE (*value); 
H 
只 释放 了 值 ， 内 此 


Table map(table, vfree, NULL); 
Table free(&table); 


释放 了 表格 中 的 值 ， 然 后 释放 表格 本 身 -。 

如 果 在 apply 中 ， 通过 调用 Tablc_put 或 Table_remove 来 改变 table 的 内 容 ， 可 能 产 小 个 
可 检查 的 运行 期 错误 。 

对于 N 个 关键 字 - 值 对 的 表格 ，Table_toArray 构 建 -个 有 2N+1 个 元 素 的 数 纪 并 返回-- 个 
指向 其 第 个 元 素 的 指 计 。 关 键 字 和 值 交 桂 出 现 ， 关 键 字 出 现 看 奇数 号 元 束 ， 而 它们 关联 的 
fife E Poeno CS gos BUS 一 个 偶数 纪元 素 ， 即 索引 号 2 赋值 end ， 通常 总 个 空 指针 > 
数组 中 关键 字 - 值 对 的 次 序 旦 不 缮 定 的 、8.2 节 中 描述 的 程序 说 明 『Table_toArray 的 使 用 ， 

Table_toArray 可 能 会 产生 异常 Mem_Failed ,而且 客户 调用 程序 必须 释放 它 返 回 的 数组 








8.2 例子: 单词 频率 


Wf 列 出 了 在 命名 文件 列表 或 标准 给 入 〈 如 果 没有 指定 文件 ) 中 出 规 的 每 个 单间 的 次 数 。 
例如 : 


X wf table.c mem.c 
table.c: 

3 apply 

7 array 

13 assert 

9 binding 

18 book 

2 break 


[i] 
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10 buckets 

4 y 

mem.c: 

1 allocation 
7 assert 

12 book 

1 stdlib 

9 void 





MAAR WRI RE. PIT PR FERE T UTA, TERR ISO AE NER PE 
TH SO. xpwixegt. -— as BP EXE. 140 Bek SO PAT SEE sü F Bl eH 
成 的 ， 大 小 写 无 关 。 

更 通用 地 涪 ， 一 个 单词 以 first 集 合 中 的 某 个 字符 开头 ,由 fest 集合 中 0 个 战 更 多 的 字符 组 
成 。 这 种 形式 的 单词 由 getword 识 别 , 该 函数 是 1.1 节 小 描述 的 doublc 中 的 getword 的 常用 定义 - 
在 本 书 中 它 就 够 内 广 ， 在 它 自己 的 搂 口中 被 单独 打包 成 : 


(getword. hy= 
#include <stdio.h> 


extern int getword(FILE *fp, char *buf, int size, 
int firstCint c), int rest(int c)); 


getword 从 fp 打开 钓 文件 中 读 取 下 “个 单词 ， 把 它 当 作 -- 个 以 null 结 果 的 字符 中 存储 在 
buf[0..size-1] 中 ， 并 返回 1。 当 它 达 到 文件 末尾 ， 而 没 找到 单词 ， 它 返回 9。 也 数 first 和 rest 济 
试 某 个 字符 是 否 忌 first 和 rest 集 合 中 的 成 员 。 一 个 单词 是 字符 的 相 邻 序列 ; 它 以 宁 符 开始 ， 
对 该 字符 first 函 数 返回 一 个 非 0 值 ， 外 加 由 函数 rest 返 回 非 0 值 的 字符 组 成 如果- -AE IC 
于 size-2 个 字符 ， 出 么 超过 的 字符 被 截断 、size 必 须 大 Fl, 30 Hfp. buf, first Ls Aresta A 
KAR, 


(getword.ġ= 
#include «ctype.h» 
#include <string.h> 
#include <stdio.h> 
#include "assert.h" 
#include “getword.h” 


int getword(FILE *fp, char *buf, int size, 
int firstCint c), int restCint c)) { 
int ií = O, c; 


assert(fp && buf && size > 1 && first && rest); 
€ = getc(fp); 
for ( ; c != EOF; c = getc(fp)) 
if (first(c)) í 
(store c in buf if it fits 120) 
€ = getc(fp); 
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break; 


for t ; € l= EOF && rest(c); c = getc(fp)) 
(store c in buf if it fits 120) 
if (i < size) 
buf[i] = 0; 
else 
buf[size-1] = 0; 
if (c != EOF) 
ungetc(c, fp); 
return i » 0; 


} 
(store c in buf if it fits 120)= 

{ 
if (i < size - 1) 
buf[i++] = c; 

H 


这 个 版 不 的 getword 比 double 中 的 复杂 一些， 因为 这 个 版 本 的 getword 必 须 在 当 某 个 





first 集 合 中 ， 而 义 不 在 rest 集 合 趾 时 才 工 作 ， 如 果 first 负数 返 电位 着 0， 表 么 该 字符 在 在 bufi , 


并 且 只 有 按 下 来 的 字符 才 传 给 rest 函 数 、 


wf 的 土 函 数 main 处理 wf 的 参数 ， 此 参数 为 文件 拿 各 。main 打 开 得 一 个 命名 文件 ， 


以 文件 指针 和 文件 名 为 参数 调用 wf: 


(wf functions 121)= 
int main(int argc, char *argv[]) { 
int i; 


for (i = 1; i < argc; i++) í 
*fp = fopen(argv[il], “r"); 
NULL) ( 
fprintf(stderr, "Xs: can't open 'Xs' (%s)\n", 
argv[0], argv[i], strerror(errno)); 
return EXIT. FAILURE; 





} else { 
wf(argv[i], fp); 
fclose(fp); 

} 


} 
if (argc == 1) wf(NULL, stdin); 
return EXIT_SUCCESS; 

} 


(wf includes 121)= 
#include <stdio.h> 
#include <stdlib.h> 
#include <errno.h> 


WEBA FEAT 





Ë. WAamain 以 ft AIBR AE À PE RH f € 





TER tU 
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wf 不 用 打印 出 文件 的 名 字 . 

wi 使 出 表格 来 存储 单词 和 它们 出 现 的 次 数 、 每 个 单词 部 换 成 小 写 ， 和 转换 成 原子 ， 作 为 炎 
SEP AA. BEF RWS RIA Ek hash 滑 数 和 比较 隆 数 ， 虽 然 wf 的 值 都 是 指 行 ,但 
是 它 仿 然 市 要 把 一 个 整数 计数 与 刍 个 关键 子 关联 起 米 。 因 此 它 分 配 -个 空间 给 计数 器 ， 并 在 
表格 中 存储 指向 该 区 域 的 指针 、 


(wf functions 121)4— 
void wf(char *name, FILE *fp) { 
Table_T table = Table new(0, NULL, NULL); 
char buf[128]; 


while (getword(fp, buf, sizeof buf, first, rest)? { 
Const char *word; 
int i, *count; 
for (i = 0; buf[i] != 'NO' ; i++) 
buf{i] = tolower(buf[i]); 
word = Atom string(buf); 
count = Table_get(table, word); 
if (count) 
C*count) ++; 
else { 
NEWCcount) ; 
*count = 1; 
Table put(table, word, count); 
} 


if (name) 
printf("%s:\n", name); 
{ (print the words 123) } 
(deallocate the entries and table 124) 
} 


(wf includes 121}= 
#include <ctype.h> 
#include "atom.h" 
#include "table.h" 
#include "mem.h" 
#include "getword.h" 


(wf prototypes 122) 
void wf(char *, FILE *); 





count — T ir) — T BRE UE FE. dn SETable get HITS, BE AMAA table, DIET 
H 3388 Be WE. ESTE, BM AOS A JE CRA ey 
Tuble_get 返 回 非 帘 指针 时 、 表 过 式 (*count)++ 将 该 指针 措 向 的 整数 加 1 。 该 表达 式 与 
*count++ 有 很 天 的 不 同 ， 牛 者 将 count 加 1 而 不 是 它 所 指向 的 整数 - 

first 和 rest 集 全 中 的 成 员 是 用 标准 天 文件 ctypeh 中 使 用 谓词 定义 的 同名 函数 来 测试 的 : 


kh & . 91 





(wf functions 121) 
int firstCint c) í 
return isalpha{c); 


} 


int rest(int c) í 
return isalpha(c) || c == '_'; 


} 


(wf prototypes 1224 
int firstCint c); 
int rest (int c); 
AWE ZR ATAA Hug, pz Oe BRS Oe. EC OR HC TU HE 
JF K qsort ot HI HEY AA o A en Rwf it: rasort rH r: BU X Bie (ñ n Tc HT S 
一 的 元 素 处 理 ， 那 么 它 就 可 以 排序 Table_toArray 返 凹 的 数 级 hiwta UR pos J BR H 
单词 和 它们 的 计数 打印 出 来 ; 
(print the words 123)= 
int i; 
void **array = Table_toArray(table, NULL); 
gsort(array, Table length(table), 2*sizeof (*array), 
compare); 
for (i = 0; array[i]; i += 2) 
printf("XdNtXsNn", *Cint *Darray[i«1], 
(char *)array[i]); 
FREE (array); 
qsort 接 收 4 个 参数 : BAA CRI TC. ee Soe E V T RAA H] 3 eB NR 
的 函数 。 为 了 把 N 个 关键 字 - 什 对 当 作 - -个 单 “的 无 素 米 处 理 ，wf 告 诉 gsort 有 N 个 元 索 ， 月 全 
Arc RE ge WP ETE US FEL 
qson HKR 2038 ROTE RRAK. d PCR AS A ET, — “MB UE H, 
— AB FL TII ER, AEA RNA TRI SEE (048 BBO TA Te Fro An, mem.c 中 
的 assert 与 book 进 行 比较 的 时 候 ， 参 数 x 和 y 如 下 ; 


x 























*—— e+ assert 
=] of 7 

y 

oof *- = book 
-十 -是 12 

















比较 盟 数 也 可 以 调用 stremp 来 比较 单词 ， 


(wf functions 121) 
int compare(const void *x, const void *y) f 
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return strcmp(^Cchar **)x, *(char **)y); 
3 


(wf includes 121)+= 
#include <string.h> 


(wf prototypes 122)+= 
int compare(const void *x, const void *y); 
we oR SAT i PC Pr SORBET IA. AU SPEEN, ERATE Ze RAE 
FRA MIR. JATable_map ER I+M . IA Table frekk ARRAY, 
(deallocate the entries and table 124)= 


Table_map(table, vfree, NULL); 
Table_free(&table) ; 


(wf functions 121)}+= 
124 void vfree(const void *key, void **count, void *c]) { 
FREE(*count) ; 
} 


(wf prototypes 1229 
void vfree(const void *, void **, void *); 


关键 字 不 被 释放 ， 央 为 它们 足 原 子 ， 内 此 关键 字 一 定 不 能 被 释放 。 除 此 之 外 ， 一 些 关键 字 有 


可 能 出 现在 下 面 的 文件 中 。 
把 各 种 wf-c 的 程序 定义 片段 收集 起 来 就 形成 fwf 程 序 
(wf.oe 


(wf includes 121) 
(wf prototypes 122) 
(wf functions 121) 


8.3 实现 


(table.c)- 
#include «limits.h» 
#include «stddef.h» 
#include "mem.h" 
#include "assert.h" 
#include "table.h" 


#define T Table T 


(types 125) 
(static functions 127) 
(functions 126) 


BN) AEE HDI RAE (WER -种 ， 参 见 练习 8.2 ) 的 常见 数据 结构 之 一 。 罗 此 每 
Table TARA - MEME A bindings AT HOM fd Ep, ARPE Je E: 
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(types 125)= 
struct T { 
(fields 126) 
struct binding { 
struct binding *link; 
const void *key; 
void *value; 
) **buckets; 
l 


buckets 指 向 有 适当 元 素数 日 的 数组 cmp Alhash BR GH MHRA RAK, A ET GE 6 
在 buckets 结 构 中 的 元 索 中 ; 


(fields 126)= 
int size; 
int (*cmp)(const void *x, const void *y); 
unsigned (*hash)(const void *key); 


Table_new 用 它 的 hint 参 数 来 选择 … 个 素数 作 为 buckets 的 大 小 ， 并 且 它 保存 cmp 和 hash 或 保存 
指向 静态 函数 的 指针 ， 用 米 比 较 和 散 列 原子 : 


(functions 126)« 
T Table new(int hint, 
int cmp(const void *x, const void *y), 
unsigned hash(const void *key)) { 
T table; 
int i; 
static int primes[] - ( 509, 509, 1021, 2053, 4093, 
8191, 16381, 32771, 65521, INT MAX 1; 


assert(hint >= 0); 
for (i = 1; primes[i] < hint; i++) 


table - ALLOC(sizeof (*table) 4 
primes[i-1]*sizeof (table-»-buckets[0])); 

table->size primes[i-1]; 

table-»cmp cmp ? cmp : cmpatom; 

table->hash = hash ? hash : hashatom; 

table->buckets = (struct binding **)(table + 1); 

for (i = 0; i < table->size; i++) 
table->buckets[i] = NULL; 

table->length = 0; 

table->timestamp = 0; 


"onu 


return table; 
i 


forifi Sgi B B primes 中 的 第 “个 等 于 或 大 于 hint 的 元 素 的 下 标 ， 而 primes[i-1] 给 出 了 
buckets t CRUEL, EE: 循环 是 从 1 并 始 的 、Mem 接 1 中 的 ALLOC 为 buckets 分 配 结 构 和 
空间 .Table 用 素数 来 作为 其 芯 列 表 的 大 小 是 因为 它 无 权 决 定 关键 字 的 艇 列 鱼 的 计算 方式 . 
近 2 (9<n<16) 的 索 数 ， 这 使 得 散 列 表 的 大 小 范围 代 广 。Atom 中 使 用 了 了 





primes AY ffi ha se: 
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个 更 简单 的 算法 ， 鸯 为 它 隔 时 也 计算 了 散 列 位 ， 
如 果 cmp 或 hash 昆 空 的 焉 数 指针 ， 那 么 就 用 以 下 两 个 蚌 数 来 代替 
(static functions 127)= 
static int cmpatom(const void *x, const void *y) í 


return x != y; 


} 


static unsigned hashatom(const void *key) { 
return (unsigned long)key>>2; 
} 


因为 如 果 x = ?， 那 么 原子 和 7 足 机 等 的 ， 所 以 当 x = y 时 cmpatom 返 岂 0 ， 否 则 返回 1 , Table 
的 这 个 特殊 实现 只 测 坛 关键 字 是 省 相 等 ， 内 此 cmpatom 并 不 需要 测试 < 和 y 的 相对 次 序 。 一 个 
原子 就 是 一 个 地 址 并 且 这 个 地 址 本 身 就 可 以 用 做 散 列 值 ; 它 总 是 循环 右 移 随 位 ， 内 为 等 个 原 
子 很 有 可 能 前 以 某 个 单词 的 词 头 边界 开始 、 肉 此 若 后 两 位 很 有 可 能 为 0 

buckets 的 每 个 元 素 部 足 一 个 binding 结 网 的 链接 表 ， 该 结构 中 存 有 关键 字 、 此 关联 的 值 
以 及 指向 链表 中 下 一 个 binding 结 构 的 指针 ,多 8.1 给 出 了 了 一 个 例子 、 等 个 链表 中 所 有 的 关键 字 
都 有 相同 的 数列 值 。 


























: - + e | Tink 
4 fal I key | value 
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RiS-1 表 的 布局 



































Table. get étitbinding 的 过 程 如 下 : 先 散 列 它 的 关键 字 ， 将 它 对 buckets 的 元 素 个 数 取 余 ， 
并 在 查找 列表 中 查找 Jikey 杠 等 的 关键 字 ， 通过 润 用 table 的 hash 和 和 cmp 函数 来 实现 。 





(functions 126)+= 
void *Table_get(T table, const void *key) { 





int i; 

struct binding *p; 

assert (table); 

assert (key); 

(search table for key 128) 
return p ? p-»value : NULL; 


H 


(search table for key 128) 
i = (*table-»hash) (key)%table->size; 
for (p = table-»buckets[i]; p; p = p-»link) 
if ((*table-»cmp)(key, p-»key) == 0) 


break; 
当 找 到 所 需 查 找 的 关键 字 的 时 候 ，for 循 环 结束 因此 它 使 得 p 指 向 感 兴 趣 移 binding 结 构 。 否 
dp 127 
JU. ps. t] 
128 





Table putt RUM. ERR TART. Bude s), AZo EHEER: hn E 
Table put RIAK EE, MEAE EOT IS He Te bindings; Hj, 3£ uq; Sn Silbuckets 
上 相应 链表 的 表 头 。Table_put 可 以 把 新 的 binding 链 接 公 链表 小 的 任何 位 名， 但 是 添加 到 链 
表 的 表 头 足 最 容易 也 最 有 效 的 方法 。 








(functions 
void *Table put(T table, const void *key, void *value) { 
int i; 
struct binding *p; 
void *prev; 


assert(table); 

assert(key); 

(search table for key 128) 

if (p == NULL) { 
NEW(p) ; 
p->key = key; 
p-»link = table-»buckets[i]; 
table-»buckets[i] = p; 
table->Tength++; 


prev = NULL; 
} else 

prev = p->value; 
p->value = value; 


table->timestamp++; 
return prev; 


1 
Table putfft&i SR IPIE Bat Jn] : 
(fields 126)+= 


int length; 
unsigned timestamp; 


加 
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length EX #8 Tbinding 44 #9 HA H; 它 出 Table_length iE lil; 


(functions 126)+= 
int Table length(T table) { 
assert(table); 
return table->length; 
i 


Aft Hytimestamp Ze fi Ux Table, puts&Table remove 4E d Heidt 4 r9 BAAR TIE. Timestamp Fi 
3k SCSETable map AA thy ETE HY OE £5 BIA IR; "Table mapu (ED llbindingüj, #48 
ALAR aCe AY. Table mapitimestamp ff) (Hite (PE IATA P. AEG Eapply s. E 
Heit SHE eMtimestamp f& & 6 05 SHARE (IL. 


(functions 126) 
void Table map(T table, 
void apply(const void *key, void **value, void *c1), 
void *cl) í 
int i; 
unsigned stamp; 
struct binding *p; 


assert(table); 
assert(apply); 
stamp = table->timestamp; 
for (i = 0; i < table->size; i++) 
for (p = table-»buckets[i]; p; p = p-»linl) í 
apply(p->key, &p-»value, cl); 
assert(table->timestamp == stamp); 


3 
Tabie_remove 问 样 也 得 找 关 键 字 ， 但 是 是 通 过 一 个 指向 binding 结 构 的 指针 的 指针 来 实现 
AY, NUH WOR 82] FC RR, ESI WRZ binding se Hy: 


(functions 12692 
void *Table_remove(T table, const void *key) { 
int i; 
struct binding **pp; 


assert(table); 
assert(key); 
table->timestamp++; 
i = (*table->hash)(key)%table->size; 
for (pp = &table-»buckets[i]; ; &(*pp)->link) 
if ((*table->cmp) (key, p)->key) == 0) { 
struct binding *p = *pp; 
void *value = p->value; 
*pp = p->Tink; 
FREE(p); 
table->length--; 








return value; 


H 
return NULL; 


} 
for 循 环 在 功能 上 等 价 于 <searej table for key 128> 中 的 for 循 环 ， 不 同 的 是 pp 措 向 的 是 指向 姆 
个 关键 部 binding 结 构 的 指针 。pP 开 始 指向 table->bucketsfil ， 此 后 沿 着 链表 前 进 ， 当 第 K+1 
个 binding 被 检查 定 后 ,pp 则 指向 链表 中 第 k 个 binding 的 link 学 段 ， 如 下 疼 所 到 。 





pp 












































x 
a 
* 
4 
X 
< 
k: 
< 





如 果 *pp 存 有 关键 字 ， 烛 么 可 以 通过 将 ?pp 赋值 为 (*pp ) ->linki$binding A b Jer ub; Tip 
保 企 *pp 的 值 。 如 果 Table_remove 找到 了 需 肚 除 的 关键 字 ， 朝 么 它 还 将 表格 的 长 度 减 1 
Table_toArray 与 List_toArray 类 似 。 它 分 配 一 个 数组 ,存储 关键 字 - 值 对 ， 以 end 指 针 纪 
束 ， 并 通过 访问 table 中 的 全 个 binding 冰 填充 数组 : 
(functions 1264 
void **Table toArray(T table, void *end) { 
inti, j = O; 
void **array; 
struct binding *p; 








assert(table); 
array = ALLOC((2*table->length + 1)*sizeof (*array)); 
for (i = 0; i < table->size; i++) 
for (p = table->buckets[i]; p; p = p-»link) { 
array[j++] = (void *)p->key; 
array[j++] = p-»value; 


array[j] = end; 
return array; 
} 


Pp->key 必 须 从 类 型 const void * 转 换 成 类 型 void *, FIA BH jf A T E HH const BJ, 数组 中 关 
SEF ALT EAE BAY. 
Table_free 必 须 释放 binding 结 构 和 Table_T 结 构 本 身 ， 释放 binding 结 构 只 有 有 在 表格 不 为 
空 的 时 候 才 需要 ; 
(functions 126)+= 
void Table free(T *table) í 
assert(table && *table); 


if (C table)-»length > 0) ( 
int i; 


[i] 
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98 
struct binding “p, *q; 
for (i = 0; i < (*table)-»size; i++) 
for (p = (*table)->buckets[i]; p; p = o) í 
q = p-»link; 
FREECp); 
} 
} 
FREEC*table); 
} 
参考 书目 浅 析 


表格 足 很 有 用 的 -种 数据 结构 ， 许 多 程序 设计 语言 部 把 它 作为 内 肉 的 数据 结构 米 使 用 、 
AWK (Aho, Kernighan #Weinberger 1988) 足 最 新 的 例子 ， 们 足 在 AWK 之 前 ， 表 格 就 出 现 
在 SNOBOL4 (Griswold 1972 ) 和 SNOBOL4 的 后 继 Icon(Griswold 和 Griswold 1990) 中 。 在 
SNOBOL4 和 Icon 中 的 表格 可 以 保 在 任何 类 型 的 值 ， 并 通过 该 值 来 进行 索引 ; (AWK JSE 
格 ( 也 称 做 数组 ) 只 能 存储 字符 串 和 数字 类 型 的 数据 ， 并 通过 它们 米 进 行 素 ?” ，Table 接 口 
的 实现 使 用 了 与 Icon(Griswold 和 Griswold 1986) 中 表格 的 实现 相同 的 技术 。 

PostScript(Adobe Systems 1990). 一 种 页 找 述 语 广 .同样 也 有 上 志 格 ， 但 是 它 把 表格 称 为 字 
眶 .PostScript 的 表格 可 以 用 “和 名字” 来 索引 ， 这 个 “名 字 ” 是 PostSeript 对 原子 的 男 一- 种 叫 
法 ， 介 是 可 以 存储 任何 类 型 的 值 ， 包 括 字典 ， 

表格 同样 也 出 现在 面向 对 象 的 以 序 泥 计 语言 当中 、 要 么 作为 内 虞 的 类 型 要 么 在 程序 库 
由: SmaliTalk 和 Objective-C 中 的 基本 鹅 序 库 就 包括 了 字 旺 非常 类 似 Taple 接 口 导出 的 表格 
这 类 对 象 通常 被 称 做 容器 (container) 对 象 、 内 为 它们 存 存 共 他 对 象 的 集合 。 

Table 接 口 的 实现 使 用 了 国定 大 小 的 和 列表。 只 要 装填 因子 ( 表 中 填 人 的 记录 数 除 以 散 
列表 的 长 度 ) 道 当 的 小 、 那 么 关键 字 只 需 查 找 很 小 的 -部 分 记录 就 可 以 找到 装填 央 子 越 大 ， 
HERE RRS. PRS PR AMAR, RITARI TE eB t PRO S 
围 由， 比如 说 5 | SETS. SRA r sh £ BO RR-A AR, PLE IBS] P B) EX. 它 将 散 列 
表 矿 充 并 重新 计算 听 有 已 仓 储 记 录 的 散 列 值 ，Larson(1988) 很 详细 地 描述 了 一 种 更 复杂 的 方 
法 ， 它 的 散 列 表 是 逐渐 扩充 (或 缩小 ) 的 ， 一 次 一 个 散 列 链 ，Larson 的 方法 中 Am hint, 
并 且 它 可 以 节省 室 间 ， 因 为 所 有 表 开 始 的 时 想 部 可 以 很 小 。 





练习 


8.1 对 关联 表 ADT 有 许多 种 可 行 的 实现 方法 例如， 在 嘻 期 版 本 的 Table 接 口中 ， 
Table_get 返 回 指向 值 的 指针 而 不 足 返回 什 本 壬 ， 风 此 客户 调用 程序 本 以 改变 这 些 
B. 在 没 寺中 ， 即 使 表格 中 关键 宁 已 绿 人 存在 ，Table_puft 也 总 足 往 表格 中 添加 - -个 
新 的 binding， 并 有 效 地 把 先前 具有 相同 值 的 binding “Ba” BR, m 
Table_remove 也 具 删 除 旧 近 的 binding 。 供 是 Table_map 可 以 访问 表格 中 听 有 的 
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8.2 


8.3 


8.4 


8.5 


8.6 


8.7 
8.8 
8.9 


binding 。 讨 沦 这 些 以 及 共 他 实现 方法 的 优先 ,设计 并 实现 -个 不 辐 的 表格 ADT. 
Table 接 口 的 设计 ， 使 得 可 以 使 用 其 他 数据 结构 来 实现 去 格 。 例 如， 比较 函数 得 到 
SP REE TM $H AM Br, RAE TR Ae HD. EA eH eT B RIK 
SER LM Table HEC). XXW RHE $54 AAW AT Bñ £ BSedgewick (1990) 

Table. map #iTable_toArray KA Hl] Ht 中 binding 的 顺序 是 不 确定 的 。 假 设 将 接口 
修改 使 得 Table_map 可 以 以 binding 插 和 人 到 支 情 的 顺序 米 访问 它们 ,并 日 Table_Array 
以 相亲 的 顺序 返回 数 组。 实现 这 种 修改 。 这 样 修改 的 实际 好 处 下 什么 ? 

假设 接口 规定 Table_map 和 Table_array 以 排 好 的 顺序 来 访问 binding 。 这 个 规定 会 使 
得 Table 的 实现 灾 得 复杂 ， 仙 是 可 以 管 化 诸如 wf 的 客户 调用 程序 对 表格 中 binding 的 
排序 ， 讨 论 该 提议 的 优点 并 实现 它 - 提示 : 在 当前 的 实现 中 ，Table_put 平 均 情况 
下 的 运行 时 间 是 常数 ， 而 Table_get 站 均 情 况 下 的 运行 时 间 也 接近 常数 .那么 在 你 
修改 后 的 实现 中 ，TabIle_put 和 Table_get 在 半 均 情况 下 的 运行 时 间 又 如 何 呢 ? 

— Hbuckets ti ADRS, BAL RR ARS ERAD. 1 Tablet Li ay SM Edi 
ETARA ARRIT E, XS CA Be Ra T8] RET buckets 的 
大 小 ,设计 一 个 测试 程序 ， 测 试 你 这 个 探 试 方法 的 有 效 性 ， 并 度 昌 它 的 好 处 。 

实现 Larson(1988) 描 述 的 线形 动态 散 列 算法 ， 并 把 它 的 性 能 与 你 前 向 练习 的 答案 进 
行 比较 。 

修改 wf.c， 合 得 它 可 以 度 匡 因为 麻子 从 不 释放 而 浪费 的 空间 。 

修改 wf.c 的 比较 函数 ， 使 得 它 按 计 数值 的 降序 来 对 数组 进行 排序 。 

修改 wf.c ， 使 得 它 对 每 个 文件 参数 按 文件 名 的 宁 芒 顺序 打印 出 结 末 。 做 了 这 种 修改 
后 ,在 8.2 节 最 并 始 给 的 例子 中 ，mem.c 中 的 计数 就 会 出 现存 table.c 的 前 面 。 





m 





第 9 章 & 8 


PRE (set) 是 不 同 成 员 的 无 序 聚 集 ， 对 集合 的 基本 操作 包括 对 集合 成 员 资 格 进行 检 

查 、 增 加 成 员 和 删除 成 员 等 ， 同 时 还 包括 集合 的 并 (union )、 交 (intersection )、 差 
( difference )， 以 及 对 称 差分 {symmetric difference ) 等 时 他 操作 。 假 如 有 两 个 集合 s 和 :， 则 
并 操作 s+t 就 是 包 食 * 中 所 有 死 素 和 ! 中 所 有 元 素 的 集合 ; 而 交 抽 作 s*t 是 ?和 ! 中 都 包含 的 元 素 的 
集合 ; 差 操作 5-! 则 表示 在 * 中 出 现 但 不 在 ! 中 出 现 的 集 台 : 至 二 对称 兹 分 操作 ， 它 常常 被 与 成 
sff 的 形式 ， 是 只 在 s 中 或 只 在 t 中 出 现 的 元 素 的 集合 。 

集合 通常 以 域 (universe ) 的 概念 来 描述 一 一 域 即 是 所 有 可 能 的 戌 员 的 集合 、 例 如 ， 字 
符 集 的 集合 通常 与 出 256 个 8 比特 字符 代码 组 成 的 域 机 联系 。 MUREX. RET AEs by 
补 集 ， 即 Us。 

集合 由 Set 接 口 提供 而 不 依赖 于 任何 域 。 滩 接口 输出 操作 集合 成 员 的 果 数 ， 但 是 从 来 不 
直接 检测 它们 。 同 表 (Table) 接口 一 样 ， Set 接 口 被 设计 成 客户 调用 程序 ， 能 够 提供 对 某 个 
特定 的 集合 里 的 成 员 的 属性 进行 检测 的 两 数 功能 . 

应 用 程序 使 用 集合 同 使 用 表格 的 方式 非常 相 侯 .事实 寺 ， 出 Se 提供 的 集合 很 像 表 
(table; 集合 成 员 是 关键 字 ， 丽 同 这 些 关键 字 相 关联 的 值 则 被 忽略 ， 


9.1 接口 


(set. A= 
#ifndef SET INCLUDED 
#define SET INCLUDED 


*define T Set T 
typedef struct T *T; 


texported functions 138) 
#undef T 
#endif 
出 Set 接 口 导 出 的 功能 被 分 成 四 组 : 2 REORUS UC. ARR HUG RR TE GE CURT | HAE SR 
合 的 操作 数 和 返回 诸如 集合 的 并 集 的 新 的 集合 的 操作 .前 三 个 功能 同 表 接口 中 的 功能 很 相似 。 
Set_T 由 下 而 的 代码 分 配 和 释放 、 
(exported functions 138)= 
extern T Set_new (int hint, 
int cmp(const void *x, const void *y), 


unsigned hash(const void *x)); 
extern void Set free(T *set); 
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Set_new 分 配 、 初 始 化 并 返回 一 个 新 的 T、hint 足 对 集合 所 应 该 包含 的 成 员 数 日 的 -个 估 
计 ; 精确 的 hint 值 虽然 能 够 改善 性 能 ， 俱 足 任何 非 负 的 值 也 是 合理 的 。cmp 和 hash 用 于 比较 
a Ek A RS 234 k UD BEA hale Ay. emp. (xy) 肯定 返回 一 个 大 于 、 
小 于 或 者 等 于 零 的 整数 ， 分 别 对 应 于 x 大 于 y、x 小 于 y 和 x 等 十 ?一 种 情况 。 如 果 cmp Guy ) 是 
3E, Wü)x ny FL 共 中 之 一 会 显示 在 集合 中 ,hash (x) t- : 定 等 于 hash (y )。Set_new 可 以 引 
发 异常 Mem_Failed 。 

如 果 cmp 是 空 PORTE, SUR RR OS, 如 果 x=y， 则 两 个 成 员 x 和 y 被 认为 是 一 致 
的 :否则 ， 如 果 hash 足 空 函数 指针 、 元 么 Set_new 将 提供 ~ 个 hash 函 数 以 适应 于 原子 (atom )- 

Set_free 释 放 xset ， 并 给 它 分 配 一 个 宝 指 针 ，Set_free 不 释放 成 员 ; Set_map 可 以 释放 成 
员 。 把 - -个 空 的 set 或 者 xset 传 递 给 Set_free 会 产生 可 检查 的 运行 期 错误 - 

HEA BRE d Fai oe rs : 


(exported functions 1384 
extern int Set length(T set); 
extern int — Set member(T set, const void *member); 
extern void Set put (T set, const void *member); 
extern void *Set remove(T set, const void *member); 


Set_iength 返 回 集合 set 的 底数 (cardinality ), SR l ZJ £343 RHH, Set member 
NRO, MRR ATER QE BUNGE, ， 如 果 不 在 ， 则 返回 0。Set_put 将 向 集合 添加 -个 
AA, MARR RS Bde te; Set_put 可 以 引发 Mem_failed MRAM SHIRA, W 
Set. remove A] VA ASE Cr BLUR RZ A. 3PELIB PRN RAR ( 其 指针 tf 能 不 同 于 原先 指 
疝 该 成 员 的 指针 )。 否则 ，Set_remove 不 进行 任何 操作 ， 且 返回 值 为 0。 试 图 将 .个 空 的 集合 
或 者 空 成 员 传递 给 上 述 这 些 例 程 中 的 任何 一 个 郁 将 会 产生 可 检查 的 运行 期 错误 。 

下 面 的 画 数 能 够 访问 - -个 集合 中 的 所 有 成 员 : 





(exported functions 138}= 
extern void Set map (T set, 
void apply(const void *member, void *cl), void *c1); 
extern void **Set_toArray(T set, void *end); 


Set_map 对 和 集 人 台 set 的 每 个 成 员 都 调用 -… 谢 apply 4% 、 它 把 成 员 和 由 客户 调用 程序 定义 的 
指针 cl 传递 给 apply 。 但 是 它 并 不 检查 cl 。 值 得 注意 的 是 ， STable_map 不同 .apply 不 能 改变 
存储 在 集合 中 的 成 员 。 把 一 个 空 app]y 函数 或 者 空 集 传递 给 Set_map 和 apply ， 通 过 调用 
Set_put 或 Set_remoye 来 改变 set 都 将 会 产生 可 检查 的 运行 期 错误 - 

Set toArray 返 回 个 N+1 个 元 素 的 数组 ， 该 数组 以 任意 的 咯 序 存放 着 N 个 集合 元素 ，end 
通常 是 一 个 空 指针 ， 它 的 值 就 是 数组 中 第 N+1 个 并 秦 的 值 。Set_toArray 可 以 引发 失常 
Mem Failed. 客 产 调用 程序 必须 释放 返回 的 数组 。 把 一 个 京 的 set 传 递 给 Set_toArray 会 产生 
可 检查 的 期 错误 。 

下 列 函数 ; 
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(exported functions 138)+= 
extern T Set_union(T s, T t); 
extern T Set_inter(T s, T t); 
extern T Set_minus(T s, T t); 
extern T Set_diff (T s, T t); 


执行 的 是 在 本 章 开 始 部 分 描述 的 四 种 集合 操作 ，Set_union 3&leiset, Set inter 返回 sxt， 
Set_minus 返 回 s-t，Set_di 作 返回 wt , ian 浙 的 T， 也 都 可 能 引发 异常 
Mem. Failed. ”它们 把 $ 或 者 ( 当 作 空 的 亿 合 但 总 返回 -个 新 的 ， 非 空 %T 。 央 此 ，Set_union 
(s, NULL ) HGR es] 一 个 备份 ， PT B K Ms 和 t 都 为 非 宅 如 有 不 同 的 比较 和 
散 列 函数 时 ， 每 个 函数 都 会 产生 可 检 查 的 运行 期 错误 。 也 就 是 说 ,，s 和 t 必 须 通过 调用 定义 了 
相同 的 比较 和 散 列 函 数 后 的 Set_new 卫 数 来 创建 


9.2 实例 : 交叉 引用 列表 


xref 打 印 在 其 输入 文件 中 的 标识 符 的 交 义 引用 列表 (cross-reference list )， 这 有 助 十 多 方 
面 的 使 用 ， 如 寻找 在 -个 程序 源 文 件 中 的 所 有 特定 标识 符 。 例 如 下 例 ， 
% xref xref.c getword.c 


FILE getword.c: 6 
xref.c: 18 43 72 


c getword.c: 7 8 9 10 11 16 19 22 27 34 35 
xref.c: 141 142 144 147 148 


F 面 的 例子 说 明 FILE 在 getword.c 文 件 的 第 6 行 和 xref.c 文 件 的 第 18 ，43 、72 行 中 被 用 到 ， 
类 伏地 ，c 出 现在 getword.c 中 11 个 不 同 的 地 方 。 其 中 每 行 只 显示 次， 即使 是 同一 行 出 纲 了 
多 个 相同 的 标识 符 也 是 这 样 。 输 出 时 则 按 顺 序列 出 了 文件 和 行 号 。 

如 果 没 有 程序 参数 ，xref 会 将 个 标识 符 的 交叉 引用 列表 发 送 到 一 个 标准 输入 上 ,但 将 
会 忽略 上 面 输出 实例 路 的 文件 各 : 

% cat xref.c getword.c | xref 


FILE 18 43 72 157 


5 141 142 144 147 148 158 159 160 161 162 167 170 173 178 
185 186 .. 


xref 的 实现 将 会 吕 示 集合 和 表 在 一 起 是 如 何 使 用 的 、 它 建立 了 -个 出 未 识 符 索引 的 表 ， 
表 中 每 个 相关 联 的 俏 都 是 另 一 个 由 文件 名 索引 的 表 。 沪 此 中 的 值 足 整 型 指针 集合 ， 指 向 文 
件 的 行 号 。 图 9-1 描 述 了 这 种 结 均 并 显示 了 标识 符 FILE 的 细 季 如 上 商 所 描述 的 耶 样 。 在 单 
个 顶级 表 (top-level table ) ( 它 足 下 面 代 码 中 identifiers 的 值 ) 中 与 FILE 相 关 磋 的 值 是 第 二 级 
Table_T， 它 带 有 两 个 关键 宇 getword.c 的 原 季 和 xrefc 的 原子 -与 这 些 关 键 字 相 关联 的 足 
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SeLT， 它 们 含有 FILE 所 出 规 的 行 号 的 指针 。 顶级 表 中 的 每 个 标识 符 部 有 第 二 级 表 ， 第 一 级 
表 中 的 每 个 关键 宁 - 值 对 部 有 - -个 集合 


identifiers 一 一 一 















































































































i getword.c - i 
- 
KI *— 6 
— p xref.c 
FILE 一 一 | 
Fa f 
La — 
ARR SULA RII & s 
(T Table T Y — 18 
o>} 72 
Lr RAR Fam REA RE 集合 
( -#Table_T ) 【多 个 SeLT) 


将 9-1 交叉 引用 列表 的 数据 结构 





(xref.c)= 
(xref includes 142) 
(xref prototypes 143) 
(xref data 146) 
(xref functions 142) 


xreffijmain 函数 很 像 wf 的 main Ge: cO] BARE HOR, RTA EW SC E Bee 
BETTIE RET CHE, TRACE ET. CPPS AUER UE SOR WH xref. ME A, MOH 
PRIE. RERBA USCHE HEEL ERR Ze HExref : 


(xref functions 142) 
int mainCint argc, char *argv[]) í 
int i; 
Table_T identifiers = Table new(O, NULL, NULL); 


for (i = 1; i < argc; i++) { 
FILE *fp = fopen(argv{i}, "r"); 
if (fp == NULL) { 
fprintf(stderr, "Xs: can't open 'Xs' (%s)\n", 
argv[0], argv[i], strerror(errno)); 
return EXIT_FAILURE; 


} else { 
xref(argv[i]. fp, identifiers); 
fclose(fp); 

了 


} 

if (argc == 1) xref(NULL, stdin, identifiers); 
(print the identifiers 143) 

return EXIT_SUCCESS; 
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(xref includes 142)= 
#include <stdio.h> 
#include <stdlib.h> 
#include «errno.h» 
#include "table.h" 

XIef 建 立 了 一 个 复杂 的 数据 结构 ， 但 当道 过 搜索 数据 结构 中 的 组 件 米 第 一 次 检查 怎样 打 

印 它 的 内 容 电 ， 会 更 容 努 理解 它 是 怎 栏 建立 的 :为 每 个 组 件 分 块 或 者 分 别 写 函数 将 有 助 于 理 
REGI EN AAS 
SS ae, AE PR PRL, RELIES, PRISES 


出 数组 ， 并 处 理 其 值 ， 这 一 步 很 像 wf 的 代码 块 <print the words 1235. 


-个 函数 print 米 乏 步 输 


(print the identifiers 143)= 


t 
int i; 
void **array = Table_toArray(identifiers, NULL); 
qsort(array, Table_lengthCidenti fiers) , 
2*sizeof (*array), compare); 
for (i = 0; array[i]; i += 2) £ 
printf("Xs", (char *)array[i]); 
print(array[i«1]); 
FREE (array); 
} 


identifiers 的 类 键 字 臣 原子 《atom )、 所 以 ， 传 递 给 标准 库 丽 数 qsort 的 比较 函数 compare 
将 与 在 wf 中 使 用 的 compare--- 致 ， 并 使 用 stremp 比较 标识 符 对 18.2 节 中 对 gsort 的 定义 解释 了 
gsort 的 参数 ): 


(xref functions 1424 
int compare(const void *x, const void *y) { 
return stremp(*(char **)x, *(char **)y); 


H 


(xref includes 142)+= 
#include <string.h> 


(xref prototypes 142)= 
int compare(const void *x, const void *y); 


identifiers} BY 4¢—} fB MBE A Sb— E, AE Aprin AB. BP ezk 


表 的 关键 字 是 原子 ， 因 此 ， 它 们 可 以 道 过 与 上 述 代 三 相似 的 代码 实现 在 数组 中 捕获 、 排序 
来 四 移动 等 。 


{xref functions 142}= 
void print(Table_T files) { 
int i; 
void **array = Table_toArray(files, NULL); 


[22] 








143 
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qsort(array, Table length(files), 2*sizeof (*array), 


compare); 
for (i = 0; array(i]; i += 22 í 
if (*Cchar *)array[i] != '\0') 


printf("NtXs:", (char *)array[i]); 
(print the line numbers in the set array [1*1] 144) 
printf¢("\n"); 
} 
FREE(array); 
H 


{xref prototypes 1434 
void print(Table T); 


print 可 以 使 用 compare ， 闪 为 关键 字 部 是 字符 中 。 如 果 没 有 文件 名 参数 ， 则 传递 给 print 
的 每 一 个 表 将 只 有 一 个 人 口 ， 并 且 关 键 字 足 一 个 零 长 度 的 原子 。print 用 这 种 约定 来 避免 在 输 
出 行 只 列表 之 前 打印 文件 名 - 

袁 中 告 个 值 都 被 传递 给 print ， 它 们 是 一 些 行 号 的 集合 。 央 为 Set 实 现 了 指针 集合 ，xref 通 
过 整 型 指针 米 表示 行 号 并 把 该 指针 加 人 到 集合 中 ， 为 打印 蕊 们 ， 将 调用 Set_toArray 函数 来 
建立 和 返 网 带 有 整 型 指针 的 以 空 字 符 作为 结束 符 的 数组 ; 然后 给 数组 排序 并 打印 这 些 整数 ; 


(print the line numbers in the set array [i«1] 142)= 
t 
int j; 
void **lines = Set_toArray(array[i+1], NULL); 
qsort(lines, Set_length(array[i+1]), sizeof (*lines), 
cmpint); 
for (j = 0; lines[j]; j++) 
printf(" Xd", *Cint *)lines[j]); 
FREE (lines); 
} 


cmpint filcompare HA, (LE VA WV 38 REE, SELL 2 Ne Br, 
(xref functions 142)+= 


int cmpint(const void *x, const void *y) { 
if (** (int **)x < **(int **)y) 





else if (**(int **)x > **(int **)y) 
return 41; 

else 
return 0; 


} 


(xref prototypes 143)+= 
int cmpint(const void *x, const void *y); 


Xref 建立 了 两 个 数据 结构 ， 该 数据 结构 由 刚 刚 讨论 的 代码 输出 。 它 用 getword 读 取 输 入 的 
标识 符 。 对 每 一 个 标识 符 ， 它 使 用 适当 的 数据 结构 形成 集合 并 把 当前 的 行 号 加 入 到 集合 中 : 
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(xref functions 142}+= 
void xref(const char *name, FILE *fp, 
Table. T identifiers)i 
char buf[128]; 





if (name =: 
name - ; 
name = Atom_string(name); 
linenum = 1; 
while (getword(fp, buf, sizeof buf, first, rest)) { 
Set T set; 
Table.T files; 
const char *id = Atom string(buf); 
(files < file table in identifiers associated with id 147) 
(set e set in files associated with name 147) 
(add linenum to set, if necessary 148) 


NULL) 





} 


{xref includes 142)+= 
#include "atom.h" 
#include "set.h" 
#include "mem.h" 
#include "getword.h" 


(xref prototypes 1434 
void xref(const char *, FILE *, Table T); 


linenum 是 一 个 全 局 变革 ,无论 何 时 first 拓 | 描 完 - 行 字符 ，linenum 都 将 增加 ;first 是 
个 函数 ， 它 被 传递 给 getword 以 识别 在 标识 符 中 的 初始 字符 。 


(xref data 146) 
int linenum; 


{xref functions 142) 
int firstCint c) { 
if (c == '\n') 
Tinenum++; 
return isalpha(c) || c == '_'; 


1 


int restGint c) í 
return isalpha(c) || c == '_' [| isdigit(c); 
} 


(xref includes 142)+= 
#include <ctype.h> 


getword 和 传递 给 它 的 first 和 rest 函 数 在 8.2 节 进行 了 描述 。 


(xref prototypes 143)+= 
int first(int c); 
int rest (int c); 





(iss) 
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通过 导航 指向 适当 集合 的 代码 必须 能 处 理 丢失 的 组 件 ， 例 如 ， 一 个 标识 符 在 第 一 次 遇 到 
时 ， 标 识 符 在 identifiers 中 将 没有 人 人口， 内 此 ， 代码 将 创建 文件 表 ， 并 把 标识 符 -文件 表 对 添 
加 到 空 用 的 dentifiers 中 : 


(files < file table in identifiers associated with id 147)= 
files = Table_get(identifiers, id); 
if (files == NULL) { 
files = Table_new(0, NULL, NULL); 
Table put(identifiers, id, files); 
i 


同样 地 ， 当 一 个 怀 识 符 在 一 个 新 文件 中 第 - -次 号 现时 ， 并 没有 行 他 的 集合 ， 因 此 -个 新 
的 集合 将 会 在 第 一 次 需要 它 的 时 候 将 其 创建 和 添加 记 文 件 表 中 : 
(set e set in files associated with name 147)- 
set = Table_get(files, name); 
if (set == NULL) í 
set = Set new(0, intcmp, inthash); 
Table put(files, name, set); 
} 
SR Ab RR FER Sif; intemp 和 inthash 比 较 并 对 这 些 整 数 进行 散 列 。intemp 同 上 面 的 
cmpiat 类 做 ， 但 是 它 的 参数 是 集合 中 的 指针 ， 因 此 它 可 以 调用 cmpint。 整 数 木 身 也 可 以 用 作 
Ú GÉ aI (hash number): 





(xref functions 142)+= 
int intcmp(const void *x, const void *y) { 
return cmpint(&x, &y); 
H 


unsigned inthash(const void *x) í 
return *Gint *)x; 
H 


(xref prototypes 14354 
int intemp (const void *x, const void *y); 
unsigned inthash(const void *x); 


在 控制 到 达 <add linenum to set,if necessary 148> 之 前 ，set 是 当前 行 号 应 该 被 插 人 到 的 集 
fr. 出 下 述 代码 来 光碟 : 

int *p; 

NEW(p); 


*p = linenum; 
Set put(set, p); 


从 是 如 果 set 已 经 包含 Tiinenum， lb 将 产生 一 个 存储 漏洞 (memory leak), [d 
节 新 分 配 的 认 间 的 指针 不 会 被 加 和 到 表 中 。 这 个 漏 润 可 以 还 过 只 有 linenum 不 在 get 中 时 才 
Aei BL Bo ER i E E: 
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(add linenum to set, if necessary 148)= 


i 
int *p = &linenum; 
if CiSet member(set, p)) í 
NEW(p); 
*p = Tinenum; 
Set_put(set, p); 
H 
H 
9.3 实现 


Sethy SCHR |Table jf) KARAM "CHE P eus SE Cr. JE LIH EI oH CRY ES Oe 
考 找 这 些 表 中 的 成 员 。 下面 的 例子 探索 了 - 些 可 行 的 集合 实现 各 Table 实 现 ， 


(set.o= 
#include <limits.h> 
#include <stddef.h> 
#include "mem.h" 
#include "assert.h" 
#include "arith.h" 
#include "set.h" 
#define T Set. T 
(types 149) 
(static functions 150) 
(functions 149) 


Set T/&- -个 散 列表 ， 里 面包 含 成 员 ， 


(types 149)= 
struct T { 
int length; 
unsigned timestamp; 
int (*cmp)(const void *x, const void *y); 
unsigned (*hash)(const void *x); 
int size; 
struct member { 
struct member *link; 
const void *member; 
3 **buckets; 


hi 
length ERA FAJR R X; timestamp Al FRY Set_ map +} PE: BJ c[ Ky x ico 4 HN uu. 
Set_map 8 iL apply KAKERA, cmp Flhash4} i] AA EEA HAN BR pá 8k , 
FlTable new —## , Set new ybuckets A 1I JC ILE UTC ACT, fesize bh (El JCB gk 
日 、 并 为 结构 T 和 buckets 数 组 分 配 空间 ; 


(functions 149)= 
T Set_newCint hint, 
int cmp(const void *x, const void *y), 








148 














149 
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unsigned hash(const void *x)) { 

T set; 

int i; 

static int primes[] = í 509, 509, 1021, 2053, 4093, 
8191, 16381, 32771, 65521, INT MAX }; 


assert(hint »- 0); 
for (i = 1; primes[i] < hint; i++) 


set = ALLOC(sizeof (*set) + 

primes[i-1]*sizeof (set->buckets[0])); 

set->size = primes[i-1]; 

set->cmp = cmp ?了 cmp : cmpatom; 

set->hash = hash ? hash : hashatom; 

set->buckets = (struct member **)(set + 1); 

for (i = 0; i < set->size; i++) 

set-»buckets[i] = NULL; 

set->length = 

set->timestamp 

return set; 








o; 


} 
Set new 用 hint 为 buckets 中 的 元 素数 日 【 见 8.3 相 关 定 义 ) 在 prime 中 选择 一 个 值 。 如 果 成 
员 是 由 cmp 或 hash 的 弯 函 数 指针 来 说 明 的 原子 ， 则 Set_new 使 用 下 面 的 比较 和 散 列 函 数 ， 在 
Table_new 中 也 使 用 相同 的 函数 。 
(static functions 150)= 
static int cmpatom(const void *x, const void *y) { 


return x != y; 


} 


static unsigned hashatom(const void *x) { 
return (unsigned long)x»»2; 
} 


9.3.1 成 员 操 作 


村 成 员 进 行 测试 就 像 在 .个 表 中 查询 一 个 关键 字 ， 散 列 潜在 的 成 员 ， 并 搜寻 从 buckets 中 
发 出 的 适当 的 列表 : 
(functions 149)+= 
int Set member(T set, const void *member) { 
int i; 
struct member *p; 


assert(set); 
assert(member); 
(search set for member 151) 


return p !- NULL; 


S 6 il 





(search set for member 151)= 
i = (*set->hash) (member) Xset-»size; 
for (p = set-»buckets[i]; p; p = p->link) 
if ((*set->cmp) (member, p->member) == 0) 
break; 


WR RAMA . Mp? 因此 ， 对 p 的 测试 决定 着 Set_memhber 的 输出 ， 
添加 一 个 新 的 成 员 与 此 类 似 ， 为 成 员 搜 二 集合 ， 如 果 搜 索 拓 败 则 把 它 加 进去 - 
(functions 149)+= 

void Set put(T set, const void *member) { 
int i; 
struct member *p; 





assert(set); 
assert(member); 
(search set for member 151) 
if (p == NULL) { 

(add member to set 151) 
} else 

p->member = member; 
set->timestamp++; 


} 


(add member to set 151)= 
NEWCp ; 
p->member = member; 
p->link = set->buckets[i]; 
set-»buckets[i] = p; 
set->Tength++; 


timestamp 用 在 Set_map 中 米 执 行 可 愉 查 的 运行 期 错误 ， 

Set_remove 通 过 将 “个 指向 成 员 结构 的 指针 的 指针 pp 移动 到 适当 的 散 列 链 的 方法 来 删除 
成 员 ， 直 到 *pp 为 空 或 《*pp ) ->member 是 相关 的 成 员 为 上 ， 在 这 种 情况 下 ,下 而 的 分 配 
*pp = (*pp)->link 将 从 链 中 删除 该 结构 < 


(functions 149)4— 
void *Set_remove(T set, const void *member) { 
int i; 
struct member **pp; 


assert(set); 
assert(member); 
set->timestamp++; 
i = (*set->hash) (member)Xset-»size; 
for (pp = &set->buckets[i]; *pp; pp = &(*pp)->link) 
if ((*set->cmp) (member, (*pp)-»member) == 0) { 
struct member *p = *pp; 
*pp = p->link; 
member = p->member; 
FREE(p); 





Š 
` 
地 
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set->length--; 
return (void *)member; 
H 
return NULL; 
H 


将 pp 移 到 散 列 链 与 Table_remove 小 的 方式 相同。 请 参见 8.3 节 实现 部 分 的 相应 定义 
Set remove 利 Set_pat 通 过 增加 战 减 少 length 域 来 跟踪 的 成 员 数 ， 其 中 length 是 出 
Set lengthi& F AY. 





(functions 149) 
int Set length(T set) í 
assert(set); 
return set-» length; 


H 
WU Re GARE, Set free Ë jp Aute HH BA HEH RHA GER. EGER lg Set zc TREE 
成 员 结构 。 


(functions 149)+= 
void Set_free(i *set) í 
assert(set && *set); 
if (Cset)-»length > 0) { 
int i; 
struct member *p, *q; 
for G = 0; i < (*set)-»size; i++) 
for (p = (*set)->buckets[i]; p; p = q) { 
q = p->link; 
FREE (p) ; 





H 
} 
FREE(*set); 
} 


Set_map 几 乎 与 Table_map 结 构 -- 致 ; (738 ALIA apply i ofc Je fb B, PLS oA e 


(functions 149) 
void Set map(T set, 
void apply(const void *member, void *c1), void *cl) { 
int i; 
unsigned stamp; 
struct member *p; 


assert(set); 
assert(apply); 
stamp = set->timestamp; 
for (i = 0; i < set->size; i++) 
for (p = set-»buckets[i]; p; p = p-»link) { 
apply(p-»member, c1); 


assert(set->timestamp stamp); 
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不 同 的 A Set mapfk ið apply B fp m $i. mid Æt Tu i dE. 因此， 
apply 不 能 改变 集合 中 的 指针 、 然 而 ， 它 可 以 贞 强 制 类 型 转换 (cast ) K ER Hen, DYE TI 
的 值 . 但 这 修改 了 集合 的 语义 

Set_toArray 比 Table_toArray Eii $; 同 List_toArray 类 似 ，Set_toArray 分 配 一 个 数组 并 


仪 仪 把 成 员 拷 贝 进去 。 


(functions 149) 
void **Set_toArray(T set, void *end) { 
int i, j = 0; 
void **array; 
struct member *p; 


assert (set); 
array = ALLOC((set->length + 1)*sizeof (*array)); 
for Gi = 0; í < set->size; i++) 
for (p = set->buckets[i]; p; p = p->link) 
array[j++] = (void *)p->member; 
array[j] = end; 
return array; 


} 
p->member 44H Mconst void* E yvoid* , Woy HUH MEAT BE 5 HL D CE 
9.3.2 集合 操作 


所 有 四 种 集合 操作 部 有 相似 的 实现 。 例 如 ，s+t 足 通过 把 s 和 t 的 每 个 元 素 加 入 到 一 个 新 的 
集合 中 来 实现 的 ， 其 做 法 可 以 是 先 复制 s ， 然 后 如 果 t 布 成 员 不 在 s 的 副 胡 中 ， 得 把 t 的 该 成 员 
加 人 到 该 副本 里 面 即 可 : 


(functions 149)+= 
T Set union(T s, T t) í 

if (s == NULL) { 
assert(t); 
return copy(t, t->size); 

} else if (t == NULL) 
return copy(s, s->size); 

else { 
T Set = copy(s, Arith_max(s->size, t->size)); 
assert(s->cmp == t->cmp && s->hash == t->hash); 
Í (for each member q in t 154) 

Set_put(set, q->member); 

1 


return set; 
) 


(for each member q in t 154)= 
int i; 











154 
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struct member *q; 
for Gi = 0; i < t->size; i++) 
for (q = t->buckets[i]; q; q = q-»link) 


WB eS copy JE E EN BHM -AEA PRS op RIBS. 


(static functions 150) 
static T copy(T t, int hint) ( 
T set; 


assert(t); 
set = Set_new(hint, t->cmp, t->hash); 
Í (for each member q in t 154) 

(add q-»member to set 155) 


了 
return set; 

H 

(add q-»member to set 155)= 

t 
struct member *p; 
const void *member = q-»member; 
int i = C*set->hash) (member) Xset-»size; 
(add member to set 151) 

} 


Set union $copy WA AOS ARRAS: 它们 知道 集合 的 表示 方法 ， 央 此 可 以 通过 把 适当 
的 hint 传 递 给 Set_new 的 方法 来 为 -个 新 的 集合 定义 散 列表 的 大 小 。 在 复制 8] ，Set_union 提 
供 了 一 个 hint; 它 使 用 和 t 中 较 大 的 那个 散 列 表 的 大 小 ， 央 为 作为 结果 的 集合 将 至 少 有 与 
Set_union 的 最 大 参数 相等 的 成 员 数 ，copy 可 以 调 册 Set_put 米 把 得 个 成 员 添 加 到 副 丰 中 类 ， 
但 是 它 通常 使 用 <add q->member to set 155> 来 直接 添加 成 员 ， 从 而 避免 [Set_put 的 没有 结 
果 的 搜索 ， 

交 s*t 用 s 和 t 中 较 小 的 散 列表 创建 了 一 个 新 的 集合 ， 并 只 把 在 s 和 t 中 都 出 现 的 元 素 加 到 这 
个 新 的 集合 中 : 





(functions 149)+= 
T Set_inter(T s, T t) { 

if (s == NULL) { 
assert(t); 
return Set_new(t->size, t->cmp, t->hash); 

} else if (t == NULL) 
return Set_new(s->size, s-»cmp, s-»hash); 

else if (s->length < t-»length) 
return Set inter(t, s); 

else { 
T set = Set new(Arith min(s-»size, t-»size), 

S-»Cmp, s-»hash); 

assert(s-»cmp == t->cmp && s-»hash == t-»hash); 
( (for each member q in t 154) 


& 会 H5 





if (Set member(s, q-»member)) 
(add q->member to set 155) 


H 
return set; 


H 
如 内: 比 ! 成 员 数 少 ， 则 Set_inter 调 用 自己 并 日 交换 S 和 t。 这 将 导致 代码 块 最 后 是 在 较 小 的 
个 集合 甲 进行 交集 运算 循环 - 
差 s 二 创建 一 个 新 的 集合 并 把 在 s 中 但 不 在 ti 的 成 员 添 加 到 里 而 。 下 述 代码 将 交换 参数 名 ， 
MA T REI (EIEI efor each member q in t 154» 3E 8 WE AEDs ; 


(functions 149)+= 
T Set minus(T t, T s) [í 

if (t == NULL)( 
assert(s); 
return Set_new(s->size, s->cmp, s->hash); 

} else if (s == NULL) 
return copy(t, t->size); 

else { 
T set = Set new(Arith min(s-»size, t->size), 

s->cmp, s->hash); 
assert(s->cmp == t->cmp && s->hash == t->hash); 
{ (for each member q int 154) 
if (!Set member(s, q->member)) 
(add q->member to set 155) 


return set; 


} 

MRA RS Zt, AHEM NET SAM CRW MSM, Mls / tib ERE 
UU. s /1 等 于 (8-t) + 《t~s )， 可 以 通过 下 述 方 法 来 完成 : 先 忽略 * ， 把 t 中 没有 的 所 有 元 素 
加 到 新 的 集合 中 ， 然 后 再 忽略 { ， 将 s 中 没有 的 所 有 元 素 加 到 新 的 集合 由。 代码 块 <for each 
member q in t 154> 用 十 在 互相 传递 时 交换 s 和 t 的 什 : 





(functions 149) 
T Set_diff(T s, T t) 1 
if (s == NULL) í 
assert(t); 
return copy(t, t-»size); 
} else if (t == NULL) 
return copy(s, s-»size); 
else { 
T set = Set_new(Arith_min(s->size, t->size), 
s->cmp, s-»hash); 
assert(s-»cmp == t-»cmp && s-»hash == t->hash); 
Í (for each member q in t 154) 
if (!Set member(s, q-»member)) 
(add q-»member to set 155) 








156 
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} 
{Tu=t;t=5;s=uU; } 
í (for each member q in t 134) 
if (ISet member(s, q-»member)) 
{add q->member to set 155) 


return set; 


有 关 这 站 个 操作 的 更 有 效 的 实现 也 是 可 能 的 ， 其 中 一 些 会 在 练习 中 探讨 。 一 个 特殊 的 情 
况 是 8 和 t 中 的 散 询 表 大 小 相等 ， 这 可 能 对 菜 些 应 用 很 有 用 ， 请 参见 练 可 9.7 。 


参考 书目 浅 析 


出 Set 和 输出 的 集合 被 应 用 到 Icon 中 的 集合 上 (Griswold and Griswold 1990 ), SUR D] 
Icon 的 相似 ( Griswold and Griswold 1986). 位 向 量 道 常用 于 代表 同 定 的 、 小 的 域 集合 ， 第 
13 襄 将 撞 述 使 用 该 方法 的 接口 

Icon 是 把 集合 作为 内 品 数 据 类 型 的 为 数 不 多 的 语言 之 一。 集合 在 SETL 中 是 主要 的 数据 
RE, FFH ARR HRE 和 控制 结构 都 被 设 订 成 能 处 理 集合 。 


练习 


9.1 
9.2 
9.3 


9.4 


9.5 


9.6 


9.7 


用 Table 实 现 Set。 

用 Set 实 现 Table 。 

Set 和 Table 的 实现 有 很 多 共同 点 。 设 计 并 实现 … 个 第 三 类 接口， 使 之 能 体 堪 它 们 的 
共同 属性 。 该 接口 的 目的 是 使 ADT 具 有 像 Set 和 Table 纱 样 的 执行 能 万 。 用 新 的 接口 
请 次 实现 Set 和 Table。 

AB (bag) 设计 - -个 接口 。 包 类 似 于 一 个 集合 HERRAT DL TKS 
次 ; 例如 ，(1 2 3 引 昆 一 组 整数 ， 而 :1 1 2 2 3S 65. Fe i o h EH x 
持 接站 实现 该 接 1 。 

copy 复 制 了 集合 的 参数 ， 竺 次 复制 -个 成 员 。 既 然 知 道 备份 中 的 成 员 的 个 数 ， 就 能 
够 一 次 分 配 所 有 的 member 结 构 ， 然 后 :小 部 分 一 小 部 分 发 送 到 适当 的 散 列 链 中 ， 
到 到 完成 整个 备份 。 执 行 这 个 方案 并 度 其 它 的 优点 。 

一 些 集合 操作 可 能 通过 下 述 方法 变 得 更 有 效 ， 把 散 列 值 存放 在 member 结 构 中 ， 以 
便 只 为 每 个 成 员 调 用 一 次 hash 函数 ， 并 只 有 在 散 列 数值 相等 的 时 候 才 调用 比较 函数 - 
分 析 此 法 所 带 来 的 好 处 ， 执 行程 序 并 分 析 结 果 。 

如 果 s 和 t 有 相同 的 buckets 数 ，s+r 等 于 菜 个 子 集 的 集合 ， 其 中 该 子 集 的 成 员 都 在 局 
一 个 散 列 通 中 -也 就 是 说 ，s+f 中 每 个 散 列 链 都 是 在 s 和 t 的 相应 的 欧 列 链 店 的 元 案 
的 集合 。 这 种 情况 会 经 常 发 生 ， 央 为 有 很 多 应 用 ， 无 论 它 们 何 时 调用 Set_new， 都 
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定义 相同 的 hint ,改变 s + ts * í. s -AARRE 上述 情况 ， 并 使 用 适当 
的 、 更 简单 有 效 的 方法 米 实现 、 
9.8 如 果 连 续 儿 行 都 出 现 了 同一 标识 符 ，xref 将 会 输出 e dtm. 例如: 


c getword.c: 7 8 9 10 11 16 19 22 27 34 35 
修改 xref.c ， 用 行 的 范围 来 代 巷 连 续 的 两 行 或 者 更 多 行 ， 
c getword.c: 7-11 16 19 22 27 34-35 


9.9 xref 分 配 了 许多 内 存 ， 但 是 只 释放 了 由 Tabie_toArray 创 建 的 内 在 数 组 。 修 改 xfef , 
使 之 能 够 最 终 释放 出 它 分 配 的 所 有 内 存 〈 当然 要 除去 原子 )， 采 取 人 在 打印 数据 结构 
时 递增 的 方法 实现 上 述 情况 是 最 容易 的 。 使 用 解决 练习 5.5 的 方法 来 检查 是 否 释放 
了 所 有 的 内 存 。 

9.10 清 解 释 为 什么 cmpint 和 intcemp 采 用 直接 比较 的 方法 来 比较 整数 而 不 是 返回 它们 相 
减 的 结果 。 也 就 是 说 ， 下 述 代码 哪里 有 问题 ( 显然 非常 简单 ) ? 是否 足 cmpint 的 
版 本 问题 ? 
int cmpint(const void *x, const void *y) ( 


return **(int **)x - **(int **)y; 


H 
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第 10 章 动态 数组 


SH (array ) 是 有 有关 值 的 同 构 序 询 ， 序 列 蛙 面 的 元 素 同 相 邻 连续 范围 的 索引 足 - -对 应 
的 :在 实际 的 编程 语 齐 中 ， 基 些 形 式 航 数组 足 帮 为 内 能 数据 类 型 来 显示 的 、 在 HET T, 
如 C， 所 有 的 数组 索引 具有 相同 的 下 限 〈lower bound )， 而 在 具 他 诸 二 中 ， 如 Modula-3 、 每 
个 数组 都 有 自己 的 范围 、 在 C 中 ， 所 有 数组 的 索引 都 足 从 零 开 始 的 。 

数组 的 大 小 归 么 在 编 兰 时 定义 ， 要 么 在 适 行 时 定义 。 前 态 数 组 的 大 小 当然 号 在 编 详 时 定 
Me ON, ECH, CE HR RA # 8 Pen] OE A TIE; 即 在 占 明 数组 int [n] Bf, naan 
WE; a ASC ETA PEI FT A 3C. (Un pA CH LE ERS AT A ed FR hE A o c 
被 分 配 的 ， 但 是 数组 的 大 小 必须 在 编译 时 确定 、 

fiTable toArray % RAGE BM AR BARA, E y fe A v EL ROS D] LEGE E 
malloc RE EM (US fie BOK SES RU. PC, CMRE CRT EL exe Fo SE. Bol - 些 语言 ， 
如 Modula-3 , HEIR re xc Ep abi CB S ATR ACD, ICE ei HH 8 AT able_toAcray ICE RU ER 
BO HE o Fee 

各 种 toArray ES Ë os. VASRA BUR GR; 木 章 中 所 描述 的 Array ADT 划 供 了 一 个 机 似 但 
E- ARA TOR. EFA AEA ste AT oC, ， 用 边界 检 碍 方法 米 访问 它们 并 扩展 或 缩 
减 它们 以 使 能 容纳 更 多 或 者 点 少 的 元 素 。 

木 章 还 描述 了 ArrayRep 接 口 。 它 为 少数 需要 购 有 效 地 访问 数组 元 来 的 客户 讲 用 程序 揭示 
了 了 动态 数组 的 表示 方法 .同时 ，Array flArrayRep GE] Y EO (two-level interface ) 或 
者 分 层 接 门 Clayered interface )。Array 定 义 了 一 个 数组 ADT 的 高 民 视 网 Chigh-level view ), 
ArrayRep JU BR MZE ba UY ADT 055 Sh -AERE Xx CH GY: 
人 ArrayRep 能 清楚 地 识别 都 些 依赖 动态 数组 表示 方法 的 客户 调 几 程序 、 表 水 方法 的 收 变 只 会 
影响 这 些 客 户 调 用 程序 ， 而 不 会 影响 其 他 大 多 数 只 导入 Array 的 客户 调用 程序 。 





H 






10.1 #0 


下 列 Array ADT 


(array. hs 
#ifndef ARRAY INCLUDED 
#define ARRAY INCLUDED 


define T Array T 
typedef struct T * 





(exported functions 162) 
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#undef T 
fendif 


导出 了 对 -- 个 N 元 素数 组 进行 操作 的 函数 ， 其 中 的 数组 通过 索引 0 到 N-1! 来 访问 .在 一 个 给 定 
数组 由， 每 个 元 素 部 有 国定 的 大 小 ， 但 是 不 同 的 数组 ， 人 允许 汉 素 具有 不 局 的 大 小 、Array_T 
H F BAE BS oy BA PERK: 


(exported functions 162)= 
extern T Array_new (int length, int size); 
extern void Array free(T *array); 


Array newArEi , $088 (63138 FARA length KAS MA. SEE AO fllength - 1, 
WedElength 20, whet, JH TR ATOR S. BP TRARY Hisize TPS, ATRE 
的 初始 值 都 十 0 。size 必 须 包 括 对 齐 可 能 需要 的 填充 任何 元 素 ， 以 便 能 够 通过 分 配 length . size 
个 字 节 来 创建 一 个 确定 的 数组 ， 此 时 ，leng 了 必须 为 正 。 如 果 leng 亿 为 负 或 size 非 正 .会 产生 
可 检查 的 运行 期 错误 ，Array_new 可 能 引发 异常 Mem_failed。 

Array-free 释 放 并 清除 *array 。 如 果 array 或 者 *array 为 空 则 会 产生 可 检查 的 运行 期 错误 。 

与 本 书 中 其 他 大 多 数 建立 空 指针 结 枸 的 ADT 不 同 ，Array 接 口 对 于 元 素 的 取 值 没有 任何 
限制 ;每 个 元 素 都 是 size 字 节 的 序列 ， 这 样 设计 的 基本 原理 是 ，Array_T 更 多 地 出 于 建立 其 
他 的 ADT; 第 11 章 中 所 描述 的 队列 就 是 一 个 例子 

函数 


(exported functions 162) 
extern int Array_length(T array); 
extern int Array_size (T array); 


返回 array 中 的 元 素 个 数 和 它们 的 大 小 。 
数组 元 素 出 下 述 代 码 来 访问 :; 


(exported functions 162)+= 
extern void *Array_get(T array, int i); 
extern void *Array put(T array, int i, void *elem); 


Array_geti PRIS ICH WHH; C Ro Raid. ILA ade 一 个 已 经 定义 了 的 C 语 言 
组 。 客户 调 用 程序 可 以 通过 出 Array_get 返 加 的 指针 来 访问 元 素 的 值 。Array_put 用 个 山 指 针 
elem 指 向 的 新 的 元 素 值 米 覆盖 第 i 个 元 素 的 值 。 不 同 T 了 Table_put ，Array_put 返 问 值 足 elem 。 它 
不 能 返回 绒 个 元 素 先前 的 值 ， 央 为 该 元 素 没 有 所 必需 的 指针 ， 并 及 它们 长 度 可 以 为 任意 字 节 。 

刀 果 i 大 于 或 者 等 于 数组 array 的 长 底 ， 或 者 elem 为 空 ， 会 产生 可 检查 的 运行 期 错误 。 调 
用 Array_ggt， 然 后 在 废除 由 Array_get 返 凹 的 指针 之 前 山 Array_Tesize 改 变 array 的 长 度 则 会 产 
生 不 可 检查 的 运行 期 错误 。 Melem 开始 的 存储 无 论 以 任何 方式 覆盖 array 的 第 个 元 素 的 存储 
均 会 产生 不 可 检查 的 运行 糊 销 误 。 

(exported functions 162) 


extern void Array resize(T array, int length); 
extern T Array copy (T array, int length); 
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Array_resize 改 变 array 的 大 小 , 以 便 它 能 容纳 length 个 元 素 , 并 在 必要 的 时 候 增 加 或 减少 ， 
如 果 leng 凶 超过 了 数组 的 当前 长 度 . 则 新 的 元 素 被 初始 化 成 0: 调用 Array_resize 将 使 先前 调 
用 Array_get 所 返回 的 值 变 得 无 效 。Array_copy 与 此 类 似 ， 但 旦 它 返回 的 是 第 一 个 有 lengtbh 个 
元 素 的 数 纠 array 。 如 果 length 超 过 farray 里 的 元 素 的 个 数 . 备份 中 超出 部 分 元 素 的 得 初始 化 
为 0。Array_resize 和 ArTay_copy 部 可 能 引发 异常 Mem_Failed 。 

Array 不 具有 利 Table_map 和 Tabie_toArray 类 似 的 功能 ， 内 为 Array_get 已 经 提供 了 了 必要 
的 机 制 来 完成 等 价 的 操作 - 

在 该 接口 中 ,把 -个 帘 的 T 传 递 给 任何 岗 数 都 将 会 产生 可 检查 的 运行 期 错误 - 

ArrayRep 接 口 揭示 了 一 个 描述 符 (descriptor ) 的 省 针 是 如 何 表 孙 一 个 Array_T 的 ， 其中， 
描述 符 是 个 结构 体 ， 它 的 域 包括 数组 元 素 的 个 数 、 元 素 的 大 小 以 及 存储 数组 的 指针 

(arrayrep.h)= 


#ifndef ARRAYREP_INCLUDED 
#define ARRAYREP_INCLUDED 





#define T Array_T 


struct T { 
int length; 
int size; 
char *array; 


LE 


extern void ArrayRep_init(T array, int length, 
int size, void *ary); 


#undef T 
#endif 
PALO-L Sb as S AAIR RR RE, BOR LEE 的 Array_new (100, 
sizeof int) 函数 返 同 的 ， 每 个 整数 有 四 个 字 节 ， 如 果 数 组 中 没有 元 素 ， 则 array 域 为 室 。 数 组 
































描述 符 有 导 被 称 为 消息 向 量 ( dope vector ), 
length| 100 oS 9 
size 4 J ~] 
array| e 
99 











图 10-1 HiArray new (100, sizeof int ) 创建 的 Array_T 
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ArrayRep 的 客户 调用 程序 只 能 读 取 个 描述 符 的 城 ， 而 不 能 对 其 进行 写 操作 ; 对 它们 进 
行 写 操 作 将 会 产生 不 可 检查 的 运行 期 错误 ,ArrayRep 保 证 当 array 是 -个 T 结 构 、i 非 负 且 小 
-Farray—>lengthAt, array—»array + i*array ->size 250 Ri HUNE HE o 

ArrayRep 也 输出 ArrayRep_init， 其 中 ArrayRep_init 初 始 化 子 由 array 指 向 的 结构 Array_T 
中 的 域 ， 分 别 给 参数 length 、size 各 ary 嗣 值 。 该 函数 使 得 客户 调用 程序 能 初始 化 它们 已 经 
人 划 其 他 结构 里 的 Array_T。 如 果 array 为 空 、size 非 止 、Iength 非 零 或 ary 非 空 ， 都 会 产 牛 可 
检查 的 运行 期 错 识 。 使 用 除 调用 Array Rep_init 外 的 其 他 方法 来 初始 化 F .将 会 产生 不 可 检查 
的 运行 期 错误 ， 








10.2 实现 


单个 动态 数组 实现 会 导出 Array 和 ArrayRep 两 个 接口 : 


(array.Q= 
#include <stdlib.h> 
#include <string.h> 
#include "assert.h" 
#include "array.h" 
*include "arrayrep.h" 
#include "mem.h" 


define T Array. T 


(functions 166) 


A length AE, MlArray new Jy EH BU 38 XR 2 30 BGH A AF0 218, 并 调用 
ArrayRep_init 米 切 始 化 描述 符 ; 


(functions 166)= 
T Array newCint length, int size) í 
T array; 


NEWCarray) ; 
if (length > 0) 
ArrayRep init(array, length, size, 
CALLOC(length, size)); 
else 
ArrayRep init(array, length, size, NULL); 
return array; 


H 
ArrayRep_init 是 初始 化 描述 符 的 惟有 有 效 的 方法 ; 使 用 其 他 方法 分 配 的 描述 符 必 须 测 用 
ArrayRep_init 来 对 它们 进行 初始 化 。 
(functions 166)+= 
void ArrayRep_init(T array, int length, int size, 


void *ary) { 
assert (array); 
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assert(ary && length»0 || length==0 && ary==NULL); 
assert(size > 0); 
array-»length = length; 
array->size = size; 
if Clength > 0) 
array-»array - ary; 
eise 
array-»array = NULL; 
+ 


道 过 调用 ArrayRep init 米 初始 化 MAMTA Ti aR. 这些 调用 能 清楚 地 识别 为 

自己 分 屿 描述 符 并 因此 依赖 于 该 表 水 的 客户 调用 稳 序 。 内 要 ArrayRep._init 不 改变 ， 可 以 在 不 

影响 这 些 容 户 调用 程序 的 情况 下 来 添加 域 ， 例 如 ， 当 -个 识别 序列 号 的 域 被 加 到 结 梳 中 
并 自动 破 ArrayRep_init 初 始 化 时 ， 可 能 会 出 现 这 种 情况 。 
Array_free 释 放 数组 木 身 和 结构 T， 并 清除 它 的 参数 : 





(functions 166)+= 
void Array free(T *array) í 
assert(array && *array); 
FREE(CC*array)--array) ; 
FREEC*array) ; 
} 


Array_free 不 用 检查 (*array)->array 是 否 为 宫 ， 因 为 FREE 搂 受 
Array_gef 和 Array_put 取 出 并 存储 Array_T 中 的 无 素 ， 





(functions 166)+= 
void *Array_get(T array, int i) { 
assert(array); 
assert(i >= 0 && i « array-»length); 
return array-»array + i*array->size; 


} 

void *Array_put(T array, int i, void *elem) { 
assert(array); 
assert(i >= 0 && i « array-»length); 
assert(elem); 


memcpy(array-»array + i*array->size, elem, 
array-»size); 
return elem; 


} 
TER: Array_put 返 回 它 的 第 iS BM. tT RR TOC AOE TLE b Hb hk - 
Airay_length 利 Array_size 返 四 类 似 的 指定 撒 述 符 的 域 ; 


(functions 166)+= 
int Array length(T array) { 
assert(array); 
return array-»length; 
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int Array_size(T array) { 
assert(array); 
return array->size; 


H 
ArrayRep 的 客户 调用 称 序 能 够 从 描述 符 中 再 接 访问 这 些 域 。 
Array_resize 通 过 调用 Mem 的 RESIZE 米 改变 数组 中 的 元 工 的 个 数 ， 并 相应 地 改变 数组 的 
length +g. 


(functions 166)+= 
void Array_resize(T array, int length) í 
assert(array); 
assert(length >= 0); 
if Carray-»length = 0) 
array->array = ALLOCClength*array->size); 
else if (length > 0) 
RESIZE(array->array, Jength*array->size); 
else 
FREECarray->array); 
array->length = length; 
H 


不 同 于 使 用 Mem 的 RESIZE , BCR A gef. HEIN ACH OR RENE. TU YR AP Fe RR 

一 全 空 的 动态 数组 。 
Array_copy 与 Array_resize 非 常 相似 ， 只 呈 Array_copy 把 array 的 描述 等 和 数组 的 -部 分 

[ws] 或 者 全 部 复制 下 来 : 


(functions 166)+= 
T Array copy(T array, int length) { 
T copy; 





assert(array); 
assert(length >= 0); 
copy = Array.new(length, array-»size); 
if (copy-»length >= array-»length 
&& array-»length > 0) 
memcpy(copy-»array, array-»array, array-»length); 
else if (array-»length > copy->length 
&& copy-»length » 0) 
memcpy(copy-»array, array->array, copy-»length); 
return copy; 


参考 书目 浅 析 


一 些 语言 支持 各 种 动态 数组 :例如 ，Modula-3 (Nelson 1991) 允许 在 运行 时 建立 任意 
范围 的 数组 .但 是 不 能 扩展 或 者 缩减 它 。Jcon (Griswold and Griswold 1990 ) 中 的 列表 很 像 
能 够 扩展 或 者 缩减 的 数组 ， 其 中 扩展 或 者 缩减 足 通过 在 序 询 的 末尾 涂 如 或 者 删除 元 素来 实现 
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的 ， 这 一 点 非常 像 下 一 章 将 要 描述 的 队列 。Icon 也 支持 从 -个 列表 中 取出 子 列 表 、 放 不 同人 
ANA BEANE — TFS GR EQ 


练习 


10.1 


10.2 


设计 并 实现 一 个 能 提供 关于 指针 的 动态 数组 的 ADT ， 它 应 该 能 够 各 过 与 Tabie 提 供 
的 胃 数 相 类 似 的 函数 对 这 些 数组 的 元 素 进 行 安全 访 站 。 在 实现 中 使 用 Array 和 
Array Rep. 
NDASE UR HERA ) 设计 -- 个 ADT， 并 用 Array 实 现 它 看 在 能 否 归 纳 
出 设计 N 维 数组 的 方法 ? 
为 “个 稀 咏 动态 数组 〔 即 数组 中 大 部 分 元 素 的 稍为 零 ) 设计 并 实现 ADT .设计 应 
该 能 接受 - 个 特殊 的 替 值 数组 ， 其 实现 只 存储 财 些 非 零 元 素 - 
把 下 列 函数 
extern void Array_reshape(T array, int length, 

int size); 
加 入 到 array 的 接口 和 它 的 实现 中 。Array_reshapc 能 够 分 虽 改 安 array 数 组 的 长 度 
length 和 元 素 的 大 小 size 。 如 同 Array_resize 、 重 新 形成 后 的 数组 保留 原始 数组 的 
前 length 个 元 素 ; 如 果 length 超 过 了 原始 长 度 ， 超 过 部 分 元 素 的 什 设 为 0 - array 中 
第 i 个 元 家 万 为 再 新 形成 后 的 数组 的 第 i 个 元 素 ， 如 果 size 化 原始 长 度 小 ， 则 每 个 元 
素 部 被 截断 ， 如 果 size 比 诛 始 值 大 ， 则 超出 部 分 的 字 节 被 设 成 0。 
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第 11 章 序 JI 


一 个 序列 (sequence) AAND. 用 从 0 到 N-1 的 整数 索引 ， 其 中 为 正 数 ， -个 空 序 
列 不 含有 值 。 同 数组 相似 ， 序 列 中 的 值 可 以 通过 索引 来 访问 ， 也 可 以 在 序列 的 任何 - - 端 增添 
RU ERSTE. 序列 会 白 动 做 必要 的 扩展 以 容纳 它们 的 内 容 、 庄 列 的 值 就 是 指针 - 

序列 在 本 书 中 是 最 有 用 的 ADT 之 <. 尽管 它 佣 的 定义 都 非常 简章 .但 它们 可 以 用 作 数 
组 、 列 表 、 栈 、 队 列 和 双 端 队列 等 ， 而 且 它 们 有 为 数据 结构 分 离 ADT 的 能 轧 ， 序列 
可 以 看 做 是 非常 抽象 的 数组 ， 数 弓 在 前 面 这 季 已 经 讲 过 ;序列 隐 知 了 数据 细节 并 在 执行 时 
HR EAS. 





i 





11.1 接口 
序列 是 一 个 在 Seq 接 口中 定义 的 隐 式 指针 关 型 的 实例 ; 


(seg. = 
#ifndef SEQ INCLUDED 
define SEQ INCLUDED 


#define T Sea T 
typedef struct T *T; 
(exported functions 172) 


#undef T 
#endi f 


把 一 个 空 的 T 传 递 给 该 接口 的 任何 程序 都 会 产生 可 检查 的 运行 期 错误 。 
序列 由 下 面 的 函数 创建 : 


(exported functions 172)= 
extern T Seg new(int hint); 
extern T Seg.seq(void *x, ...); 


Seq_new 创 建 并 返回 一 个 空 序列 。hint 是 对 这 个 新 序列 所 容纳 的 最 大 值 的 一 个 估计 。 如 
果敢 个 最 大 值 不 确定 ， 央 hint 为 零 ， 并 创建 .个 较 小 的 序列 。 必 让 时 序列 会 扩展 容量 而 不管 
hint 的 值 。 如 果 hint 为 灸 ， 则 会 产生 可 性 查 的 运行 期 错误 - 

Seqg_seq 创 建 并 返 同 -个 序列 ， 它 的 初始 化 值 在 它 的 非 容 指针 参 
个 空 指针 来 终 目 。 央 此， FERE 


Seq_T names; 





中 :参数 列表 出 第 - - 


names = Seq seg("C", "ML", "C++", "Icon", "AWK", NULL); 
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创建 了 一 个 带 有 五 个 值 的 序列 并 把 它 赋 给 names ， 参 数列 表 中 的 值 与 从 0 到 4 的 索引 相关 联 。 
在 Seq_seq 的 可 释 参 数列 去 变 基 部 分 传递 的 指针 被 假定 为 空 指针 ， 内 此 在 传递 字符 型 或 void 
型 以 外 类 型 的 指针 时 ， 程 序 员 必 须 提 供 强制 类 型 转换 ， 请 参见 7.1 节 的 相关 内 容 。Seq_new 和 
Seq seq fini AJIA S Mem, Failed. 
(exported functions 172)+= 
extern void Seq_free(T *seq); 
释放 并 清除 *seq 。 如 果 seq 或 者 *seq 为 空 指针 ， 则 会 产生 可 检查 的 运行 期 错误 ， 


(exported functions 172)+= 
extern int Seg_length(T seq); 


返回 序列 seq 的 值 的 数 日 。 
W 个 值 的 序列 中 的 值 与 从 0 到 N-1 的 整数 索引 相关 联 。 这 些 值 能 被 下 述 函 数 访问 ; 


(exported functions 172)}4= 
extern void *Seq_get(T seq, int i): 
extern void *Seg put(T seq, int i, void *x); 


Seq. geti plseq-p 828; fi, Seq put Sie (for wee JIS BUR AU. S KT 
于 N， 则 会 在 运行 时 出 现 检 测 错误 。Seq_get 和 Seq_put 在 固定 的 时 间 访 问 第 个 值 ， 

序 诉 可 以 通过 在 其 端 中 的 任何 一 端 增 漆 值 的 方法 来 扩展 。 

(exported functions 172}4= 


extern void *Seq_addlo(T seq, void *x); 
extern void *Seq_addhi(T seq, void *x); 


Seq_addlo 将 x 加 到 低 端 并 返回 x 第 .在 序 询 的 开始 增加 -- 个 值 将 会 使 得 已 经 存在 的 值 的 
索引 和 序列 的 长 度 都 增加 1 。Seq_addhi 将 x 加 到 seq 的 高 端 并 返回 x 值 ， 在 序列 的 术 端 增加 - 
个 值 只 使 序列 的 长 度 加 1 。Seq_addlo 和 Seq_addhi 可 以 引发 异常 Mem_Failed 。 

类 似 地 ， 序 列 可 以 通过 在 seq 任 意 一 端 删除 值 的 方法 来 缩减 

(exported functions 172)4= 

extern void *Seq remlo(T seq); 
extern void *Seq remhi(T seq); 

Seq_remio 在 seq 的 低 端 删除 并 返回 UP. 在 序列 的 开始 删除 -个 值 使 得 已 经 在 在 的 什 
的 案 引 和 序列 的 长 度 部 减 1。Seq_remhi 将 在 seq 的 高 端 删除 并 返 问 一 个 值 ， 在 序列 的 未 端 删 
BR -个 值 只 使 序 全 的 长 度 减 1 , Seq_remlo 和 Seq_remhi 可 以 引发 异常 Mem_Failed 。 


11.2 实现 


就 像 在 木 章 开始 说 明 的 懂 样 。 序 列 是 -- 个 动态 数组 的 高 度 抽 象 化 。 内 此 它 的 描述 包 会 动 
态 数 组 一 一 不 足 一 个 指向 Array_T 的 指针 ， 而 星 Array_T 结 构 本 和 对 它 的 实现 将 导 人 Array 
和 ArrayRep ; 





£ #l 


129 





{seq.O= 

#include <stdlib.h> 
#include <stdarg.h> 
#include <string.h> 
#include "assert.h" 
#include "seq.h" 
#include "array.h" 
#include "arrayrep.h" 
#include "mem.h" 


#define T Seq T 


struct T { 


Struct Array_T array; 


int length; 
int head; 
Is 


(static functions 179) 
(functions 175) 


leng 由 域 包含 序列 中 的 值 的 数目 ，array RE ñ Pe sh Bod OT AE BEI EAR - VC MG OR ty 
length 个 元 素 ， 但 足 如 果 length 小 于 array.lengthij ， 有 一 部 分 元 素 没有 被 合用 ， 数 组 被 用 做 


循环 的 缓冲 区 以 容纳 序列 值 。 序 列 
以 数组 大 小 为 模 的 连续 的 元 素 中 、 


的 第 0 个 值 存储 在 数组 头 元 素 head 中 、 连 绪 的 值 赋 存储 在 
也 就 是 说 ， 如 果 序 列 的 第 i 个 值 仓储 在 第 array.length-] 个 


元 素数 中 ， 则 第 i+1 个 值 仓 储 在 歼 组 的 第 0 个 元 系 中 ， 赂 11-1 帮 示 了 一 个 7 值 序列 可 以 存储 在 


-个 16 元 素 的 数组 中 的 -- 种 方法 
影 表 示 。 右 边 的 表格 是 数 组 ， 它 的 


length] 16 


左边 的 表格 是 Sed_T 和 已 经 插 人 的 Array__T , HIRE Aoi 
阴影 区 显示 了 被 序 询 中 的 值 所 占用 的 拒 素 。 


























size} 4 
array * 上 一- 
length 7 — 
head} 12 一 一 J 

















FEL 1678H HU 


JERR HEAR AB RE OPH EL KH Rh 3 Rhead fr Jy ett Me fit INS E 8 AYE 
头 ， 义 通过 以 数组 大 小 为 模 增 加 head 的 方法 将 数值 从 序列 开头 删除 ， 一 个 序列 奶 终 带 有 一 个 


数组 BHE PY ER M S DUAL 


通过 分 配 一 个 动态 数组 可 以 创建 “个 新 的 序列 ， 该 动态 数 级 包含 hint 指 针 ， 当 hint 为 0 时 








175 
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含有 16 个 指针: 


(functions 175)= 
T Seq_new(int hint) { 
T seq; 


assert(hint >= 0); 

NEWO(seq); 

if (hint 0) 
hint - 16; 

ArrayRep init(&seq-»array, hint, sizeof (void *), 
ALLOC(hint*sizeof (void *))); 

return seq; 





} 


FANEW Od€ length filhead Et #4 (ENO. Seq_seg 调 用 Seq_new， 创 建 个 空 序列 ， 然 后 通过 
它 钓 参数 调用 Seq_addhi ， 从 而 批 生 个 依 添 加 到 这 个 新 的 序列 由: 


(functions 175)+= 
T Seq_seq(void *x, ...) { 
va_list ap; 
T seq = Seq_new(0); 


va start(ap, x); 

for C; x; x = va arg(ap, void *)) 
Seq. addhi (seq, x); 

va end(ap); 

return seq; 


Seq seq fH ZOK MPLS KE BLA. Xx AIR List list, HESS 1287.2 Ti FR REALE 
Array free af ELE — FE T]. 包括 释放 数组 利 它 的 描述 符 : 


(functions 175)+= 
void Seq_free(T *seq) { 
assert(seq && *seq); 
assert((void *)*seq (void *)&(*seq)->array); 
Array free((Array. T *)seq); 





于 
能 够 调用 Array_free 仅 仅 足 内 为 在 代码 中 ， 有 *sed 的 地 址 等 于 名 (xseq)_>array 的 断 占 。 也 就 
是 说 ， 结 构 Array_T 一 定 是 结构 Seq_T 的 第 -个 域 ， 以 使 而 Seq_new 中 出 NEWO 返 回 的 指 伸 既 
指向 Seqg_T， 义 指 问 Array_T 
Seq_length 只 返回 序列 的 lengtb 域 ; 


(functions 175)+= 
int Seq_length(T seq) { 
assert(seq); 
return seq->length; 
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序列 中 第 i 个 值 在 储 在 数组 中 的 第 《head +i) mod array.length 个 元 素 中 。 一 个 类 型 强制 


转换 (type cast ) 使 得 直接 对 数组 进行 索引 成 为 可 能 ; 


(seq[i] 177)= 
((void **)seg-»array.array)[ 
(seq->head + +)%seq->array. length] 


Seq_get 只 返回 该 数组 的 元 素 ，Seq_put 把 它 设 成 x : 


(functions 175)+= 
void *Seq_get(T seq, int i) { 
assert(seq); 
assert(i >= 0 && i < seg-»length); 
return (seq[i] 177); 


} 

void *Seq_put(T seq, int i, void *x) { 
void *prev; 
assert(seq); 


assert(i >= O && i < seq->length); 
prev = (seq[i] 177); 

《seq[i] 177) = x; 

return prev; 


} 


Seq _remloflSeq_remhi JK— PIX FIN BE ff, Seq. rembi Tix DU BIO eb TE fay ras, 


因为 它 只 减少 leng 耻 域 并 返回 由 一 个 新 的 length 案 引 的 信 : 


(functions 175) 
void *Seq remhi(T seq) { 
int i; 


assert(seq); 
assert(seq-»length > 0); 
i = --seq-» length; 
return (seq[i] 177); 

3 


Seq-remlo 稍 微 复杂 一 点 ， 因 为 它 必 须 返 团 出 head 索引 的 值 (heag 的 信 存 序列 中 由 0 索引 )， 


按照 数组 大 小 来 增加 head ， 并 降低 length : 


(functions 175)+= 
void *Seq. remlo(T seq) í 
int i = 0; 
void *x; 


assert(seq); 

assert(seq-»length > 0); 

x = (seq[i] 177); 

seq->head = (seq->head + 1)%seq->array. length; 
--seq-»length; 

return x; 











177 
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Seq_addlo#Seq_addhi #8 E 4 (du B| FY FU FEA R Ak Hb i TRE YE, 5 
length 等 于 array.length 时 会 出 现 这 种 情况 。 当 满足 上 述 条 件 时 ， 这 两 个 是 数 都 将 调用 expand 
来 扩展 数组 ， 这 是 通过 调用 Array_resize 来 实现 的 。 同样 ，Seq_addhi 是 这 两 个 函数 中 比较 简 
单 的 个， 内 为 扩展 检查 后 ， 它 用 由 leng 志 h 给 的 案 引 来 在 储 这 个 新 值 并 增加 length ; 


(functions 175)+= 
void *Seq addhi(T seq, void *x) í 
int i; 


assert(seq); 

if (seq->length == seq->array. length) 
expand(seq) ; 

i = seq->length++; 

return (seq[i] 177) = x; 


) 


S$eq_addio 也 进行 扩展 检查 .但 是 然后 按照 数组 大 小 降低 head , 45x Efl eH št head AR 
引 的 数组 元 素 中 ， 即 是 序列 由 出 0 索引 的 值 : 


(functions 175H= 
void *Seq addTo(T seq, void *x) í 
int i = O; 

assert (seq); 

if (seq->length == seq->array. length} 
expand(seq) ; 

if (--seq->head < 0) 
seq->head = seq-»array.length - 1; 

seq->length++; 

return (seq[i] 177) = x; 


} 

Seq addlofliseq—head = Arith_mod(seq—>head -1,seq->array.length) 来 降低 seq->head 。 
expand 封 装 了 对 Array_resize 的 调用 ， 其 中 Array_resize 使 一 个 序列 数 的 大 小 加 倍 ; 
(static functions 179)= 


static void expand(T seq) { 
int n = seq->array. length; 


Array_resize(&seq->array, 2*n); 
if (seq->head > 0) 
(slide tail down 179) 
} 
IERI EIR {US EIE AS (AB PE. expand ths ZI 2b FDIS 3: 4 EARDER PRIX ADH, BRE head yy 
好 知 ， 否 则 原始 数组 末端 的 元 素 一 从 head 往 下 一 一 必须 移 到 扩展 后 的 数组 的 木 端 以 便 能 
打开 中 间 的 元 素 ， 如 赂 11-2 所 天 ，head 也 必须 做 相应 的 调整 : 
(sfide tail down 1739)= 


{ 


void **old = &((void **)seq->array. array) [seq->head]; 
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memcpy(olden, old, (n - seq-»head)*sizeof (void *)); 
seq->head += n; 


01d —— 


old«n 


图 11-2 扩展 一 个 序列 


参考 书 县 浅 析 


序列 与 Icon 中 的 列表 几乎 一 致 (Griswold and Griswold 1990), 但 是 操作 的 名 称 来 自 库 
中 的 Sequence 接 口 ， 该 库 Modula-3 ( Homing, et al. 1993 ) 的 DEC 实现 联系 在 一 起 。 本 章 
中 描述 的 实现 也 与 DEC 实现 相似 。 练 习 11.1 探 讨 了 Icon 的 实现 。 


练习 


11.1 Tcon 实 现 列表 一 一 它 的 序列 版 本 一 一 带 有 一 个 存储 块 的 双 链 镁 列表 其 中 每 个 存 
储 块 有 M 个 值 。 这 种 表示 方法 各 免 了 使 用 Array_resize ， 因 为 如 有 必要 ， 新 的 存储 
块 可 以 加 到 列表 的 任意 一 端 ， 以 有 效 地 调用 Seq_addlo 和 Seq_addhi 。 这 种 表 不 方 
法 的 缺点 足 存储 块 必须 移动 访问 第 ! 个 元 素 ， 所 花 的 时 间 与 i/ M 成 比例 。 使 用 这 种 
表示 方法 为 Seq 建 立 一 个 新 的 实现 并 开发 一 些 测试 程序 来 测试 它 的 性 能 。 假 定 对 值 
i 的 访问 几乎 总 是 在 对 值 -1 或 值 i+1 的 访问 之 后 ， 你 能 修改 实现 使 得 这 种 情况 能 以 
男 定 的 时 间 运 行 吗 ? 

11.2 为 -个 不 使 用 Array_resize 的 Seq 设 计 一 个 实现 。 鲍 如 ， 当 N 个 元 素 的 数组 被 十 满 
后 ， 它 可 能 被 转化 成 数组 指针 的 数组 ， 其 中 每 个 数组 有 2MN 个 元 素 ， 因 此 转换 后 的 
序列 可 包含 2N? 个 值 。 如 果 N 等 于 1024， 则 转换 后 的 序列 将 有 超过 两 百 万 个 元 索 ， 
每 个 元 索 都 能 在 固定 的 时 间 被 访问 。 在 这 种 边缘 矢量 (edge-vector ) 表示 法 中 ， 
每 个 具有 2 个 元 素 的 数组 只 要 存 有 数值 ， 都 可 以 随意 地 分 配 。 

11.3 ”假定 禁止 使 用 Seq_addle 和 Seq_remlo， 设 计 一 个 实现 ， 使 之 能 够 递增 地 分 配 空间 ， 
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但 是 能 在 对 数 时 间 访 问 作 何 元 素 . 提示 : Skip list (Pugh 1990 ). 

11.4 序列 只 扩展 而 从 本 缩 减 修改 Seq->remto 和 Seg ->remhi， 使 之 在 数组 中 半数 以 上 
的 元 未 没有 使 用 由 ， 即 当 seg-~>length 小 十 seg->array,length/2 时 ， 呆 以 缩减 序列 、 
什么 时 候 不 应 做 这 样 的 修改 ? 提示 ; thrashing ( At AIRE, 

11.5 肯 次 用 序列 调 不 是 集合 来 实现 xref 以 保存 行 号 。 晓 然 文 件 足 按 顺 序 读 取 的 ， T H. 
因为 它们 都 将 按 升 序 在 序列 中 经 支 ， 所 以 不 必 对 行 号 进行 排序 ， 

11.6 改写 Seq_free .使 它 无 再 再 使 用 断言 。 注 意 ; 不 能 使 用 Array_free - 








第 12 章 KH 


环 (ring) 很 像 序 询 : ERE HAN TJA UN LEE GRE SEEN TR. HUNAR -个 
空 的 环 没有 值 。 所 滑 的 值 就 是 指针 。 同 序列 的 值 一 样 ， 坏 里 的 什 也 可 以 由 索引 来 访问 ， 

与 序列 不 同 的 是 , 值 可 以 漆 加 到 环 的 任 休 地方 ， 并 卫 环 中 的 任何 信者 可 以 被 眶 除 。 另外. 
TR ares: MA RR” PI KE 为 模 会 降低 每 个 值 的 索引 ， 而 向 右 “ 旋 转 ” 则 
以 环 的 长 度 为 模 增 加 每 个 值 的 索引 。 以 上 散 法 的 代价 是 ， 当 访问 第 ;个 下 素 时 ， 不 能 保证 花 
费 的 时 间 是 国定 的 。 





12.1 接口 


知名 四 义 、 环 足 一 个 双 链 接 的 列表 的 抽象 化 ， 但 是 Ring ADT 增 示 了 环 只 是 - -个 隐 式 指 
针 类 型 的 实例 ; 
(ring. f= 


#ifndef RING_INCLUDED 
#define RING_INCLUDED 


#define T Ring_T 
typedef struct T *T; 


(exported functions 184} 
#undef T 
fendif 


将 qom ERREUR BBE CE BEE ABS t n EG ARDE CHER UR. 
创建 环 的 函数 与 在 Seq 接 口中 所 使 用 的 edic 2840 : 


(exported functions 184)= 
extern T Ring_new (void); 
extern T Ring ring(void *x, ...); 


Ring_new 创 建 并 返回 一 个 空 的 环 。 Ring_ring AAG -S AO de FL 
的 非 掌 指针 参数 。 参 数列 表 山 第 一 个 空 指针 参数 米 终 目 、 央 此 


Ring_T names; 


names = Ring_ring("Lists", "Tables", "Sets", "Sequences", 
"Rings", NULL); 
QUSE T — si SL BL NUR RUS + A, HEE names, BST AC EC AO Bld By BE 
IHRE. EPR BY SR Jong a HE ME db Pt ARIEL SER TT. PE ERARE 8 
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针 或 者 字符 型 指针 时 ， 程 序 员 必须 提供 强制 转换 ， 请 参见 7.1 节 的 由 关 讨论 。 Ring_new 和 
Ring ring TEL 31% 5 dfMem, Failed, 


(exported functions 1844 
extern void Ring.free (T *ring); 
extern int Ring Jength(T ring); 


Ring_free 释 放 *ring 指 加 的 ring 并 清除 *ring- dnHiringsl &* ring 4-84 HM PAE ë 
查 的 运行 期 错误 。Ring_length 返 四 在 ring 小 的 值 的 数 日 。 
-个 长 度 为 N 的 环 中 的 值 由 整数 0 到 N-1 索 引 BME (ec RP ROGER ; 


(exported functions 18442 
extern void *Ring get(T ring, int i); 
extern void *Ring put(T ring, int i, void *x); 


Ring geG& Flring THY fi MA. Ring. putfEring HH 4S) ffi Dax SPR JE fr o img 
i 大 于 或 者 等 于 N 则 会 产生 可 检查 的 运行 期 错误 。 
值 通过 下 列 函数 添加 到 ring 中 的 任何 地 方 : 


(exported functions 184) 
extern void *Ring add(T ring, int pos, void *x); 


Ring_add 在 位 普 pos 将 x 添 加 到 ring 中 ， 并 返回 x。 一 个 有 个 值 的 ring 中 的 位 置 如 下 图 所 
水 ， 这 是 一 个 带 有 从 0 到 4 的 整数 索引 的 五 元 素 环 。 
1 2 3 4 5 6 








-5 -4 -3 -2 -1 0 

图 中 中 间 一 行 数字 表示 索引 . BT TE EB IF I-II SERES EKE 
置 定义 了 环 的 末端 具体 的 位 置 ， 它 并 不 知道 环 的 长 度 。 位 置 0 和 1 在 容 的 环 中 也 是 有 效 的 。 
Ring_add 能 接受 任 仔 形式 的 位 告 。 定 义 一 个 并 不 存在 的 位 置 会 产生 可 检查 的 运行 期 绒 误 ， 不 
存在 的 位 甸 包 括 超过 坏 的 长 度 的 位 管 和 人 负 位 壮 的 绝对 值 超过 环 的 长 度 的 位 置 。 

增加 一 个 新 的 值 使 得 它 右边 的 人 的 索引 和 上 整个 坏 的 长 度 都 增加 一 。Ring_add 可 以 引发 异 
常 Mem_Failed 。 

函数 

(exported functions 184)4= 


extern void *Ring addlo(T ring, void *x); 
extern void *Ring addhi(T ring, void *x); 


等 同 于 在 Seq 接 口中 命名 的 类 似 的 两 数 ，Ring_addio [Ring add (ring, 1, x) 等 价 ， 
Ring-addhi 癌 Ring_add(ring,0,x) 等 价 。Ring_addlo 和 Ring_addhi 才 可 以 引发 异常 
Mem Failed , 
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函数 


(exported functions 1844 
extern void *Ring remove(T ring, int i); 


删除 并 返回 ring 中 的 第 i 个 值 。 痢 除 个 值 将 使 得 在 它 右面 的 部 分 的 镜 余 的 值 索引 减 1。 如 果 i 
大 于 或 者 等 于 ring 的 氏 度 ， 则 会 产生 可 检查 的 运行 期 铺 误 - 
同 Seq KR AX 6558 UE, FA RR 


{exported functions 184)+= 
extern void *Ring_remlo(T ring); 
extern void *Ring remhi(T ring); 


删除 并 返回 ring 中 低 端 或 者 高 端的 值 。Ring_remlo 癌 Ring_remove(ring,0) 等 价 ,Ring_remhi 
FRing_remove(ring. Ring_jength(ring)-1) 等 价 。 将 一 个 空 的 ring 传 递 给 Ring_remlo 或 
Ring_remhi 将 会 产生 可 检查 的 运行 期 错误 。 

"ring" f) "EX AFI ete. 


(exported functions 384) 
extern void Ring rotate(T ring, int n); 


该 函数 通过 左旋 或 者 右 旅 对 ring 中 的 值 进行 重新 编号 。 如 果 n 为 止 ring Ahe CREIER ) 
n 个 值 ， 每 个 什 的 索引 也 以 ring 的 长 度 为 模 增加 a。 将 -个 含有 元 素 A 到 H 的 ring 向 右 旋 转 一 次 
的 情况 如 下 图 所 示 ; 其 中 箭头 指向 第 一 个 元 喜 。 


AC ON G À 
edd DTC 

如 果 n 为 负 ，ring 向 左旋 转 (BD MAT EERE RE) naii, ti MERRE ring 的 长 度 为 模 减 
少 n。 如 果 n 以 ring 的 长 度 为 模 必 0，Ring_rotate 无 效 。 如 果 n 的 绝对 值 超过 了 ring 的 长 度 ， 则 
会 产生 可 检查 的 运行 期 错误 。 


H 








12.2 实现 


实现 把 一 个 环 描绘 成 一 个 带 有 两 个 域 的 结构 : 


(ring.c)= 
#include <stdlib.h> 
#include <stdarg.h> 
#include <string.h> 
#include "assert.h" 
#include "ring.h" 
#include "mem.h" 


#define T Ring. T 


struct T í 
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struct node { 
struct node *llink, *rlink; 
void *value; 
} *head; 
int length; 
1; 
(functions 188) 


head 域 指向 一 个 node 结构 的 双向 链接 列表 ， 其 中 node 结 构 里 的 value 域 含有 ring 中 的 值 ， head 
指 癌 与 索引 0 相关 联 的 值 ， 连 续 的 值 存放 在 由 rlink 成 链接 的 node 里 而， 并 且 每 个 node 的 Dink 
域 都 指 癌 它 的 前 者 。 图 12-1 显 从 了 一 个 带 有 六 个 值 的 ring 的 结构 。 点 划 线 源 自 llink 域 并 递 时 
针 运 动 ， 而 实 线 源 自 rlink 域 并 顺 时 针 旋 转 : 


| head 
y { 6 | length 





























* [llink 


»| 

r-* | rlink 
{ value 
Y 






































二 
4 * [e * 
` . 


图 12-1 一 个 六 元 素 的 环 


(functions 188)= 
T Ring new(void) { 
T ring; 


NEWOCring); 
ring->head = NULL; 
return ring; 


) 


Ring_ring 创 建 了 一 个 空 的 环 ， 然 后 调用 Ring_addhi 添 加 它 的 全 个 指针 参数 ， 直到 第 一 个 空 指 
针 为 止 ， 但 不 包含 第 一 个 空 指针 : 
(functions 188)+= 
T Ring ring(void *x, ...) í 
va_list ap; 
T ring = Ring_newQ); 


va_start(ap, x); 
for € ; x; x = va arg(ap, void *)) 
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Ring_addhi (ring, x); 
va_end(ap); 
return ring; 


} 


释放 一 个 环 首先 要 群 放 node 结 构 ， 然 后 释放 坏 头 。 因 为 node RR MME AR RB. MLL 


Ring_free 只 是 Brlink 指 针 的 顺序 释放 . 


(functions 188)+= 
void Ring_free(T *ring) { 
struct node *p, *q; 


assert(ring && *ring); 

if (Cp = (*ring)-»head) != NULL) í 
int n = (*ring)-»length; 
for ( ; n-- > 0; p = q) í 


q = p-»rlink; 
FREE Cp); 
} 
1 
FREE(*ring); 
} 
UR 


(functions 188) 
int Ring length(T ring) { 
assert(ring); 
return ring-»length; 


3 
返回 环 中 的 值 数 。 


Ring-gct 和 Ring_put 必 须 找到 环 中 的 第 i 个 元 素 。 这 样 算 米 ， 要 把 列表 移动 到 第 i 个 节点 


结构 中 ， 该 操作 是 出 下 述 函 数 完成 的 ， 
(q — ith node 189)= 


int n; 
q = ring->head; 
if (i <= ring->length/2) 
for (n = i; n-- > 0; ) 
q = q->rlink; 
else 


for (n = ring-»length - i; n-- > 0; ) 


q = g-»llink; 
了 


上 述 代 衫 以 最 短 的 路 径 到 达 第 i 个 节点 ， 如果 不 超过 坏 长 度 的 一 半 ， 第 一 次 循 乓 要 通过 rlink 
Feet UO HERRIETA. BM, Adlink 道 时 千 旋 转 。 例 如 ， 在 图 12-1 中 ，0 到 3 通过 


右 旋 来 达到 ，4 和 5 要 通过 左旋 来 达到 。 
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Ib OX MURS. EG SUI E ROCA TS 


(functions 1884 
void *Ring_get(T ring, int i) { 
struct node *g; 


assert(ring) ; 

assert(i >= 0 && i < ring->length); 
(q e ith node 189) 

return g->value; 


} 


void *Ring put(T ring, int i, void *x) í 
struct node *q; 
void *prev; 


assert(ring); 

assert(i >= 0 && i < ring->length); 
{q e ith node 189) 

prev = q->value; 

q->value = x; 

return prev; 


H 
向 环 添加 值 的 函数 必须 分 配 一 个 节点 ， 对 它 进 行 切 始 化 ， 并 把 它 插入 到 双向 链接 列表 的 
适当 的 位 窒 。 它们 也 必须 能 处 理 向 一 个 字 环 肉 加 节点 的 操作 ，Ring_addti 是 这 些 函 数 中 最 简 
单 的 一 个 : 它 把 -个 新 的 告 点 插 人 到 出 head 指 向 的 节点 的 左边 ， 如 图 12-2 所 示 。 深 色 的 阴影 
用 于 区 分 新 的 节点 ,右边 图 中 较 重 的 线 显示 了 于 条 链 路 改变 了， 下 面 是 代 友 ， 


(functions 188)+= 
void *Ring addhi(T ring,-void *x) { 
struct node *p, *q; . 








assert(ring); 
NEW(p); 
if ((q = ring->head) != NULL) 
(insert p to the left of q 1915 
else 
(make p ring's only value 191) 
ring->length++; 
return p->value = x; 


H 
A-SI 个 值 很 简单 : ring ->head 指 向 这 个 新 的 节点 , 而 节点 的 链接 指向 节点 
AS. 
(make p ring's only value 191)= 
ring->head = p-»llink = p->rlink = p; 


如 疼 12-2 所 示 的 那样 ，Ring_addhi 在 环 中 的 第 一 个 节点 就 指向 fq， 并 把 新 值 插 人 到 它 
的 左边 。 这 种 插入 包括 初始 化 新 节点 的 链 ， 并 收 必 q 的 llink 和 gq 的 前 珍 的 rlink 的 方向 : 
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(insert p to the left of q 191)= 


p-»llink = q->llink; 
q->1link->rlink = p; 
p->rlink = q; 
q-»liink = p; 








=a 





MI 






































(12-2 38— 1- SHA 到 head 的 左边 


图 12-3 序 列 的 第 二 到 第 五 个 图 说 明了 这 四 个 语句 各 自 产生 的 影响， 得 一 步 中 深 色 的 曲线 
表示 新 的 链 。 当 q 指 向 双向 链接 列表 中 的 惟 - -的 节点 时 ， 重 新酒 出 这 个 序列 是 有 益 的 。 
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图 12-3 将 一 个 新 的 节点 搬入 到 q 的 左边 
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Ring_addlo 玫 乎 是 一 样 的 简单 ， 只 足 这 个 新 的 节点 成 为 环 中 的 第 个 节点 。 这 种 转换 可 
用 省 过 调用 Ring_addhi 然 后 再 癌 右 旋转 -次 来 实现 ， 而 癌 右 旋转 是 通 过 把 head 的 值 设 成 它 的 
前 普 的 从 来 实现 的 - 





(functions 188)+= 
void *Ring.addlo(T ring, void *x) { 
assert(ring); 
Ring. addhi (ring, x); 
ring-»head = ring-»head-»]llink; 
return x; 


1 
Ring add A R A A By BUR ñi Ra e Ze -个 .因为 它 将 处 理 前 而 讲述 的 任意 位 
兽 的 添加 情形 ， 包 括 环 的 两 端 。 这 些 情 况 可 以 利用 Ring_addloe 和 Ring_addhi 处 理 林 端 浴 加 问 
题 的 方式 来 解决 ， 顺 使 注意 环 为 空 的 情况 。 对 士 其 他 情况 ， 转 换 俩 的 索引 的 位 壮 到 右边 R 
后 将 新 的 节点 添加 到 它 的 左边 ， 如 上 上 所 述 。 


(functions 188)+= 
void *Ring_add(T ring, int pos, void *x) { 

assert (ring); 

assert(pos >= -ring->length && pos«-ring-»length«1); 

if (pos == 1 || pos == -ring-»length) 
return Ring addlo(ring, x); 

else if (pos == 0 || pos == ring->length + 1) 
return Ring addhi(ring, x); 

else { 
struct node *p, *q; 
int i = pos < O ? pos + ring->length : pos - i; 
(q e= ith node 189) 
NEW(p) ; 
(insert p to the left of q 191) 
ring->length++; 
return p->value = x; 


} 
BUTEA) OTH KERER ETE. ji 的 初始 化 处 理 1 到 ring_>lengthb_1 的 索引 机 应 的 位 等。 
这 二 个 鹏 除 值 的 函数 都 比 三 个 增加 值 的 两 数 简单 ， 内 为 删除 值 没有 内 限 的 限 币 .惟一 的 
个 限制 中 删除 环 中 最 后 一 个 人 时 需 蜂 注意 .Ring_remove 在 这 三 个 因数 中 是 最 典 者 的 ， 它 
寻找 第 i 个 节点 并 从 双向 链接 的 列表 中 将 它 出 除 : 
(functions 188)+= 
void *Ring remove(T ring, int i) í 
void *x; 
struct node *q; 


assert(ring); 
assert(ring-»length » 0); 
assert(i >= 0 && i < ring-»length); 
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(q — ith node 189) 
if Gi == 0) 
ring->head = ring->head->rlink; 
x = q->value; 
(delete node q 194) 
return x; 
H 
如 果 i 为 0 .Ring_remove 删 除 第 一 个 节点 ， 因 此 必须 改作 head 的 方向 指向 --- 个 新 的 第 一 
增加 -个 节点 需要 对 由 个 撕 针 进行 操作 ， 侧 山 除 一 全 节点 只 需要 对 阿 个 指名 me 
(delete node q 194)= 
q-»llink-»rlink = q-»rlink; 
g-»rlink-»liink = g-»llink; 
FREE (q); 
if (--ring-»length == 0) 
ring->head = NULL; 


图 12-4 的 第 一 和 第 三 个 图 表 说 明 在 这 个 代位 块 的 开始 商行 说 名 各 和 白 产生 的 影响 。 受 影响 的 链 
用 深 色 的 曲线 表 乒 ， 在 <detete node q 194 R — RIAD PE A. AS ARB A] Wiring 
的 eng 由， 并 在 最 后 一 个 节点 被 册 除 时 清除 它 的 head 指 年 ， 同 样 ， 思 出 从 一 个 或 两 个 节点 的 
列表 中 删除 一 个 节点 的 序列 是 有 有益 的 。 




































































闻 12-4 AUT eg 


Ring_remhi 与 此 类 似 ， 只 是 寻找 指定 的 WAE EE 


(functions 188)+= 
void *Ring_remhi(T ring) { 
void *x; 
struct node *q; 





assert(ring); 
assert(ring-»length > 0); 
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q = ring-»head-»llink; 
X = q->value; 
(delete node q 194) 
return x; 
H 
195 如 上 所 示 ，Ring_addlo 通 过 调用 Ring_addhi 和 改变 ring 的 head 值 使 之 指向 它 的 前 者 来 实 
现 的 。Ring_remlo 的 实现 方式 是 : 改变 ring 的 head 使 之 指向 后 首 ， 并 调用 Ring_remhi。 
(functions 188)+= 
void *Ring remlo(T ring) í 
assert(ring); 
assert(ring-»length » 0); 
ring-»head = ring->head->rlink; 
return Ring_remhi (ring); 
了 


最 后 -个 操作 是 旋转 个 环 。 如 果 p 为 正 ， 一 个 N 值 的 环 顺 时 征 旋 转 ， 这 就 意味 着 以 N 为 
模 的 索引 n 成 为 新 的 head 。 如 果 n 为 负 ， 环 道 时 针 旋 转 ， 这 意味 着 它 的 head 移 到 索引 n+N 所 指 
的 值 上 。 


(functions 188)+= 
void Ring_rotate(T ring, int n) { 
struct node *q; 
int i; 


assert(ring); 
assert(n >= -ring-»length && n <= ring->length); 
if (n >= 0) 
i = n%ring->length; 
else 
i = n + ring-»length; 
(q < ith node 189) 
ring->head = q; 


} 
这 里 ， 使 用 <9g<- node 189» 确保 旋转 路 径 最 短 。 


参考 书目 浅 析 


Knuth ( 1973a ) 和 Sedgewick ( 1990 ) ss 详细 处 理 双 向 列表 的 算法 
[e] Icon 扣 供 的 -HESIO FANN PR PE ir FREU IE Ringe 00 3840 , 12-40} f Icon 
的 实现 。Ring_add 中 定义 位 置 的 程序 来 自 Icon 。 


练习 


12.1 改写 Ring_fres 中 的 循环 ， 油 除 变量 n ; 使 用 列表 结构 来 决定 循环 何 时 结束 。 
122 仔细 检查 Ring_rotate 的 实现 ,解释 为 什么 第 一 个 if 洁 句 一 定 和 要 写 成 i=n+ring->length、 
12.3 MARing get(ring, DER CER 9H — BUB, WRing get(ring,is1). 修改 实现 ， 
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di XR RE AE ILAZ È FOR Ur IR 6 38 0 AA, HA eS ERU EE $ë fE 
«q«-ith node 189» 11838. AES T "UB IDA. SOBRE AP e rfe 8. EET 个 
测 运 程序 ， 来 证 明 你 的 改 普 带 来 的 好 处 

Icon 实现 列表 回环 相似 ， 问 带 有 六 个 值 的 数组 的 双 闪 链接 链表 也 类 似 、 这 些 数组 被 
用 敌国 形 缓冲 区 ， 就 像 数 年 在 Seg 的 实 焉 中 孙 样 ， 寻 找 第 i 个 值 可 以 近似 地 向 下 搜 
索 环 列表 中 的 i AN 个 数 织 ， 然 后 计算 数组 中 第 i 个 值 的 索引 。 增 加 一 个 值 ， 要 么 把 
它 加 到 -个 已 经 存在 的 数组 的 空 内 位 党 ,页 么 增加 到 一 个 新 的 数 织 .删除 :个 值 
则 空 出 数组 中 的 “个 位 置 ， 而 晶 ， 如 果 要 肌 除 的 值 是 数组 中 最 后 :个 ， 则 此 时 也 
从 列表 中 删除 并 释放 。 这 种 胡 示 方法 比 本 章 中 描述 的 最 复杂 得 多 ， 但 是 它 对 士 较 
大 的 环 性 能 较 寻 。 使 用 这 种 方法 再 次 实现 环 ， 首 测试 这 两 种 实现 的 性 能 。 坏 要 多 
大 才能 检测 到 性 能 的 改善 ? 


第 13 章 位 向 = 


第 9 帝 讲 述 的 集合 可 以 带 有 任意 个 元 案 ， 因 为 这 些 元 索 仪 仪 由 客户 调用 程序 提供 的 阻 数 
来 进行 处 理 、 整数 集合 灵活 性 更 差 - 些 ， 但 是 使 用 它们 通常 就 足够 确定 一 个 独立 的 ADT 。 
Bit 接 站 导出 处 理 位 向 虹 (bit vector ) 的 函数 ,位 向 景 可 以 表示 从 0 到 N-1 的 整数 集合 。 例 如 ， 
256 比 特 的 向 景 可 有 效 地 吉 示 字符 型 集合 ， 

Bite Bt r d set HMA OMAR, 还 有 少量 函数 足 专门 针对 位 向 量 的 。 不 同 于 
由 Set 提 供 的 集合 ， 出 位 向 量 提供 的 集合 有 “个 非常 好 的 定义 城 ， 是 从 0 到 N-~1 的 整数 型 集合 。 
因此 ，Bit 林 以 提供 Set 不 能 提供 的 函数 ， 如 -个 集合 的 补 集 (complement )。 

13.1 接口 

位 向 营 这 个 名 字 解 释 了 整数 型 集合 的 表 水 方法 在 本 质 上 是 比特 序列 。 然 而 ，Bit 接 口 只 
导出 一 个 表示 - -个 位 向 景 的 隐 式 类 型 ; 

(bit. A= 

#ifndef BIT INCLUDED 
define BIT INCLUDED 


define T Bit T 
typedef struct T *T; 199 





(exported functions 200) 


fundef T 
#endif 
当 Bit_new 创 建 -个 位 向 其 后 ， 该 佑 向量 的 长 度 就 同 定 了 : 
(exported functions 200)= 
extern T Bit new (int length); 
extern int Bit length(T set); 
extern int Bit count (T set); 
Bit_new 创 建 了 一 个 新 的 length 个 位 长 的 向 晤 ,并 把 所 有 的 位 郁 设 为 0。 位 向 量 表示 人 包含 
本 从 0 到 length -1 位 的 整数 集合 。 如 果 ieng 人 bh 为 负 则 会 产生 可 检查 的 运行 期 错误 。Bit_new 可 
VASE AR Mem Failed, 
Bit length;& Mset+7 BU rft. MjBit_count Mlalset 41 AVA A, 
V&Bit, union, Bit inter. Bit minus 和 Bit_di 闻 之 外 ,将 一 个 空 的 T 传 递 给 该 接口 的 任何 
例 程 者 会 产生 可 检查 的 运行 期 错误 。 
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(exported functions 200) 
extern void Bit free(T *set); 


RENE RI set, MRset aH tseUu m, ， 则 会 产后 可 检查 的 运行 期 错误 ， 
Set 中 的 各 个 元 素 ( 它 的 向 量 中 的 每 一 位 ) HP ed BORE. 
(exported functions 2004= 


extern int Bit_get(T set, int n); . 
extern int Bit put(T set, int n, int bit); 


Bit_get 返 同比 蛙 n 值 并 测试 是否 在 set 中 ; 即 Bit_get 当 比特 n 在 set 中 时 返回 ] 而 当 n 不 在 
set 中 时 返回 0。Bit_put 根 据 bit 在 位 向 量 中 设置 比特 n 并 返回 比特 n 对 应 的 位 向 量 中 先前 值 , n 
为 负 或 者 大 于 等 于 set 的 长 度 ， 或 者 bit 杂 不 是 0 也 不 是 Htjf ， 会 产生 可 检查 的 期 错误 ， 
上 述 函 数 处 理 set 中 的 各 个 位 ; 而 下 列 西数 则 处 理 set 中 的 相 邻 的 比特 序列 一 一 一 个 set 的 
FR. 
(exported functions 200}= 
extern void Bit clear(T set, int lo, int hi); 


extern void Bit set (T set, int lo, int hi); 
extern void Bit not (T set, int lo, int hi); 


Bit. clearitt iR Mlo Bhi (tk efr, Bit_set ew lo Ring te HY, Bit_not 到 从 10 到 hi 比特 
位 的 补 集 。 如 果 10 超 过 站 、lo 或 首 击 为 负 ， 以 太 lo 束 者 hi 大 于 等 J set 的 长 度 ， 部 会 产生 可 愉 查 
的 运行 期 错误 





(exported functions 200)+= 
extern int Bit_it (T s, T t); 
extern int Bit eq (T s, T t); 
extern int Bit leq(T s, T t); 


Bit It Es Ct 时 返 同 1 ， 否 则 返回 0。 如 巢 s ct, Wiese E. qus ct, MBit eq 返回 1. 
否则 返回 0。 如 果 s ct， 则 Bit_leq 返 回 1 ， 和 否则 返回 0。 对 所 有 这 :个 函数 如 果 s 和 t 的 长 度 不 
等 ， 则 会 产生 可 检查 的 运行 期 错误 。 

BRE 


(exported functions 2004s 
extern void Bit map(T set, 
void apply(int n, int bit, void *cl1), void *cl); 


从 堆 比 特 位 开始 ， 为 set 中 的 每 个 比特 位 调用 apply 函 数 .。n 是 比特 序号 ， 其 值 从 0 到 集合 的 长 
MA, ，bit 号 位 ni B, cl PARR 不 同 于 传递 给 Table_map 的 函数 ，apply 可 
以 改变 set 的 值 。 如 果 为 比特 np 调用 apply 却 改变 了 比特 k 的 值 ， 其 中 k>n， JU A RE de Bs 
对 apply 的 调用 中 看 到 ， 因 为 Bit_map 必 须 在 合适 的 位 置 来 处 理 比 特 位 。 否则 就 要 在 处 理 它 的 
比特 之 前 让 Bit_map 对 向 其 进行 备份 

下 述 函 数 执行 四 个 标准 的 集合 操作 ,在 第 9 章 中心 丝 有 所 讲述 竺 个 函数 都 返回 一 个 新 
的 集合 ， 其 信 就 是 操作 结果 。 


fe ow X 149 





(exported functions 200) 
extern T Bit union(T s, T t); 
extern T Bit inter(T s, T t); 
extern T Bit minus(T s, T t); 
extern T Bit diff (T s, T t); 


Bit unionj& fis fit FS, As +t 表 水 ， 是 两 个 位 向 其 做 或 COR ) 运算 。 Bit_interig Als Rt. 
的 交集 ， 用 s*t 表 示 ， 是 两 个 位 向 车 做 己 辑 与 (AND ) 运算 。Bit_minus 返回 和 t 的 差 Fist 
RR. Asst ZH 与 运算 。Bit_diff 返 回 > 和 {的 对 称 差分 (symmetric difference )， 用 
SARR, BSAF R (exclusive OR ) 运算 - 

CU e PR CE EAE n BO TS de dE ( 但 不 能 s 和 t 均 为 空 )， 并 把 对 应 集合 解释 成 空 集合 。 
Bit_union (s, NULL) 返回 $ 的 一 个 副本 。 这 些 函 数 总 是 返回 北 空 的 T。s 和 t 均 为 空 ， 会 产生 
可 检查 的 运行 期 错误 ，s 利 [有 不 同 的 长 度 也 会 产生 可 检查 的 运行 期 错误 。 这 些 函数 都 可 引发 
异常 Mem_Failed - 


13.2 实现 


Bit_T 是 带 有 位 向 量 的 长 度 和 比特 本 身 的 结构 的 指名 ; 


(bit.ġ= 
#include <stdarg. h> 
#include <string.h> 
#include "assert.h" 
#include "bit.h" 
#include "mem.h" 


define T Bit. T 


struct T í 
int length; 
unsigned char *bytes; 
unsigned long *words; 
h 


(macros 203) 

(static data 207) 
(static functions 212) 
(functions 203) 


length 域 给 出 了 向 最 中 的 比特 数 ，bytes 指 向 至 少 llength / 8] 个 字 节 。 通 过 索引 bytes 可 以 访 
ME, bytes [i] 指向 带 有 从 8 ,i 到 8 .i+7 比 特 的 宁 节 ,其 中 8 :i 是 字 节 中 最 低 有 效 数字 位 
注意 ,该 规定 只 用 于 繁 个 字符 8 位 的 倩 况 ， 对 于 超过 8 位 的 机 器 ， 则 超出 的 位 将 不 使 用 ， 

如 果 所 有 访问 单个 比特 的 操作 ， 比 如 Bit_get ， 者 使 用 相同 的 约定 来 访问 位 ， 则 可 以 将 比 
特 存 储 到 无 符号 长 整 型 数组 中 来 进行 处 理 。Bit 使 用 字符 数组 来 允许 表 驱 动 实现 Bit_count 、 
Bit set, 、Bit_clear 和 Bit_not 。 
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一 些 操作 ， 比 如 Bit_union ， 玫 行 处 理 所 有 的 比特 位 。 对 于 这 些 杏 作 ， 通 过 words tf 以 在 
同一 时 间 访 问 BPW 个 比特 的 向 时 


(macros 203)= 
#define BPW (8*sizeof (unsigned long)) 


其 中 words 必 须 指向 一 个 无 符号 长 整 型 数 ; nwords 计 算 一 个 带 有 length 比 特 位 的 位 向 量 所 合 
的 长 整 型 数 的 个 数 : 


(macros 2034— 
#define nwords(7en) ((((Ten) + BPW - 1)&(-(BPW-1)))/BPW) 


Bit, newf£ Hinwords 4 B. — 4-35 BUT : 


(functions 203)= 
T Bit newCint length) f 
T set; 


assert(length >= 0); 
NEWCset); 
if (length > 0) 
set->words = CALLOC(nwords (length), 
sizeof (unsigned long)); 
else 
set-»words = NULL; 
set-»bytes - (unsigned char *)set-»words; 





[203] set-»length - length; 
return set; 
} 
Bit_new 至 多 可 以 分 配 sizeof (unsigned long ) -1 个 额外 的 字 节 ， 这 些 额 外 的 字 节 必须 为 9 以 
使 下 列 两 数 能 正确 地 执行 。 
Bit_free 释 放 了 集会 并 清除 它 的 参数 Bit_length ik [length bt 
(functions 203) 


void Bit free(T *set) { 
assert(set && *set); 
FREE((*set)-»words); 
FREE(*set) ; 

} 


int Bit length(T set) { 


assert(set); 
return set-»length; 


19.2.1. 成 员 操作 


Bit-count 返 回 集合 中 的 成 员 数 一 一 即 集 合 中 每 ~- 个 位 值 为 1 的 个 数 、 该 丽 数 可 以 简单 地 
遍历 集合 并 测试 每 个 比特 位 ,但 足 它 使 用 两 个 “于 字 节 ”: 区 它 的 两 个 “本 比特 半 字 节 ”》， 
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Vf Fio i538 5| — FE 为 所 有 16 个 可 能 的 半 字 节 提 供 位 值 为 1 的 个 数 : 


(functions z203}= 
int Bit_count(T set) { 
int length = 0, n; 
static char count[] = { 
0,1,1,2,1,2,2,3,1,2,2,3,2,3,3,4.}; 


assert (set); 
for (n = nbytes(set-»length); --n >= 0; ) í 
unsigned char c = set-»bytes[n]; 
length += count[c&0xF] + count[c»»4]; 
} 204 


return length; 





1 


(macros 203)+= 
#define nbytes(7en) ((((Ten) + 8 - 1)&(~(8-1)))/8) 


nbytes 计 算 [len / 8], EH FRETS il BUCHER AUTRE, ORR SET PEAS 
length 和 字 节 的 两 个 出 比特 半 字 节 的 比特 数值 之 和 相 加 来 计算 集合 中 第 n 宁 节 中 的 比特 数 。 该 
循环 可 以 访问 外 部 企 储 空间 的 比特 位 ， 但 是 关 为 Bit_new 将 所 有 比特 均 初 始 化 为 0， 所 以 这 种 
芒 问 不 能 改变 丽 数 执行 结果 。 
HUP Jy n /8 中 的 位 数 为 n 9%68 的 表示 数值 ， -个 字 节 中 的 位 数 从 0 开始 并 从 右 向 左 增 
加 ， 即 最 低 有 效 数字 位 是 位 0 ， 最 高 有 效 数字 位 是 位 7 。 Bit_get 返 回 比特 na 的 值 ， 是 通过 将 字 
Fin /8 向 右 移动 na 人 %8 位 并 只 返回 最 右边 的 位 的 方法 来 实现 的 : 
(functions 2034 
int Bit get(T set, int n) í 
assert(set); 
assert(0 <= n && n < set-»length); 


return (bitn in set 205); 
} 


(bit n in set 205)= 
(Cset-»bytes [n/8]>>(n%8)) &1) 


Bit_put 使 用 相同 的 方式 设 闸 比特 n， 如 果 bit 为 1，Bit_put 将 比特 1 向 左 移 动 n %8 位 ， 并 将 其 结 
果 与 set 中 第 n /8 字 节 内 容 进 行 或 运算 。 


{functions 203)+= 
int Bit put(T set, int n, int bit) £ 
int prev; 


assert(set); 

assert(bit == 0 || bit == 1); 
assert(0 <= n && n < set-»length); 
prev - (bitn in set 205); 

if (bit == 1) 
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set->bytes[n/8] [=  1<<(n%8); 
else 
set-»bytes[n/8] &- -(1««(nX8)); 
return prev; 


H 
dn ES os, Bit put JE |Bk— 4- fid oe n Us n, Xe HERP ， 第 n%8 位 起 0 而 其 他 位 都 
是 1 ， 然 后 将 这 个 掩 码 与 set 中 第 n / 8 字 节 内 容 进 行 与 运算 。 

Bit, set, 、Bit_clear 和 Bit_not 都 采用 相似 的 手段 来 设置 set 中 的 某 段位 范围 ， 或 清除 和 到 补 
集 ， 但 是 它们 的 处 理 更 加 复杂 ， 因 为 它们 必须 处 理 范围 超过 字 节 边界 限制 的 情况 。 例 如 ， 如 
时 set 有 60 位 ， 函 数 

Bit_set(set, 3, 54) 
将 设置 首 字 节 中 第 3 到 第 7 位 、 第 一 到 第 五 字 节 中 所 有 的 位 和 第 六 字 节 中 的 第 0 到 第 6 位 ， 其 中 
字 节 是 从 0 开始 计数 的 。 这 三 个 从 右 到 左 的 区 域 ， 如 下 图 ， 分 别 用 不 用 的 阴影 表示 。 


7 6 5 4 3 2 1 0 


第 七 字 节 中 高 四 位 比特 位 不 使 用 ， 内 此 始终 为 0。Bit_set 函 数 代码 块 反 应 了 这 三 个 区 域 : 


(functions 203}= 
void Bit set(T set, int lo, int hi) { 

(check set, lo, and hi 206) 

if Clo/8 < hi/8) í 
(set the most significant bits in byte 10/8 207) 
(set all the bits in bytes 10/8«1..hi/8-1 207) 
(set the least significant bits in byte hi /8 207) 

} else 
(set bits 10%8..hi%8 in byte 10/8 208) 




















} 


¿check set, 10, and hi 206)= 
assert(set); 
assert(0 <= lo & hi < set-» length); 
assert(lo <= hi); 


当 lo 和 hi 指向 不 同 字 节 中 的 位 时 ， 在 字 节 lo /8 中 设置 的 位 数 将 依赖 于 lo %8 : 如 果 1lo 98280, 


- 将 设置 所 有 的 比特 位 ， 如 果 为 ?， 只 设置 最 高 有 效 数字 位 。 所 有 的 可 能 性 都 存储 在 由 lo %8 索 


引 的 掩 码 表 中 ; 


(static data 207)= 
unsigned char msbmask{] = { 
OxFF, OxFE, OxFC, OxF8, 
OxFO, OxEO, OxCO, 0x80 
N 


msbmask[lo%8] 与 字 节 lo / 8 取 或 将 设置 适当 的 位 : 
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(set the most significant bits in byte 10/8 207) 
set-»bytes[10/8] |= msbmask[10X8]; 


在 第 二 个 区 域 ， 每 个 字 季 的 万 有 的 位 都 设 为 1。 


(set all the bits in bytes 10/8+1..hi/8-1 207)= 


t ; 
int i; 
for (i = 10/841; i < hi/8; i++) 
set-»bytes[i] = OxFF; 
} 


hicsior GEHE Nhi; 8 中 哪些 位 :如果 hi%&8 为 0， 只 设置 最 低 有 效 数 字 位 ; 如 果 是 7， 将 
BEMA RKE M HE, hasy AE -个 表 的 索引 ,以 使 选择 适当 的 掩 全- 与 hi 78 取 战 : 


(set the least significant bits in byte hi/8 207)= 
set-»bytes[hi/8] |= lsbmask[hi*8]; 


(static data 207) 
unsigned char isbmask[] = í 
0x01, 0x03, 0x07, OxOF, 
Ox1F, Ox3F, Ox7F, OxFF 
J; 
当 lo 和 hi 指向 同 - -个 宁 节 中 的 位 时 ， 由 msbmask [lo%8 J füsbmask [ hi%8 | 提供 的 掩 
码 可 以 结合 起 来 设置 适当 的 比特 位 。 例如 
Bit.set(set, 9, 13) 
3e CH AE GU Len TBM A, KER ERRE KRA, ARB 是 
msbmask [1] 和 lsbmask [5] (4712 (BARN ARAL, 3208 AE ERT A E ERS e hy 
HEGER, PA Ob ROR OLAS Ran FPF a: 


(set bits 10%8,.hi%8 in byte 10/8 208)= 
set->bytes(10/8] |= (mask for bits 10%8..hi%8 208); 


(mask for bits 1o%8..h3%8 208)= 
(msbmask{10%8J&1 sbmask [hi%8) ) 


Bit_clear 和 Bit_not 邮 Bit_set 处 理 类 做 ，msbmask 和 1sbmask 的 使 用 方法 也 类 似 。 对 
Bit_clear 而 言 msbmask 和 1sbmask 提 供 了 分 别 与 字 节 io / 8 和 hi / 845 IE AUR) : 


(functions 203)+= 
void Bit.clear(T set, int lo, int hi) í 

(check set, lo, and hi 206) 

if (10/8 < hi/8) { 
int i; 
set->bytes[10/8] &= ~msbmask[10%8] ; 
for (i = 10/8+1; i < hi/8; i++) 

set-»bytes[i] = 0; 

set-»bytes[hi/8] &- ~1sbmask [hixs] ; 

} else 
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set->bytes[10/8] &= «(mask for bits 10%8..hi%8 208); 
了 


Bit_not 必 须 翻 转 从 lo 公 hi 的 比特 位 ， 这 是 通过 与 掩 仙 的 或 非 运算 敌 盖 适当 的 比特 
现 的 : 


(functions 20345 . . 
void Bit not(T set, int lo, int hi) í 
208 (check set, 1o, and hi 206) 


if (10/8 < hi/8) { 
int i; 
set-»bytes[1o/8] A= msbmask[10%8]; 
for (i = 10/8+1; i < hi/8; i++) 
set-»bytes[i] A= OxFF; 
set-»bytes[hi/8] A= 1sbmask[hi%8] ; 
} else 
set->bytes[10/8] A= (mask for bits 1o%8..hi%8 208); 





} 


位 米 实 


Bit_map 为 集合 中 的 每 个 位 者 调用 apply 函 数 。 它 传递 位 序号 、 它 的 值 和 客户 调用 程序 提 


供 的 指针 。 


(functions 203}= 
void Bit_map(T set, 
void applyCint n, int bit, void *cD, void *cl) ( 
int n; 


assert(set); 
for (n = 0; n < set->length; n++) 
apply(n, (bitn inset 205), c1); 


WEER, Bitmap hi 5 KEA (Bit. eR 268] (1 See 925 BIRRO KARE 0028 


SOR (GH fhe n SRA TE HAR SR. PLE TG EDS RE BM 
bytes[n/8] 中 复制 到 一 个 临时 变量 ,然后 -次 次 地 通过 移 位 和 掩 码 运 








Set 一 > 


算 来 取出 每 个 比特 位 、 


仍 是 这 种 改变 破坏 了 接口 ， 接 口 规定 如 果 apply 改 变 了 它 还 没有 看 到 的 比特 位 ， 则 它 将 在 随 


后 的 调用 中 看 到 新 的 值 。 


13.2.2 比较 


Bit eg 比较 集 合 s 和 t， 如 果 它 们 相等 则 返回 1， 如 果 NEU HO, XX Edd Eos Ot dU 


ATA BUTE ASS BY BOR TE RNY, JEEL Ll 了 s 不 等 到 ， 则 立即 退出 循环 : 


(functions 203)H= 
int Bit eq(T s, Tt) { 
[209] int i; 
assert(s && t); 
assert(s-»length == t->length); 
for (i = nwords(s->length); --i >= 0; ) 
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if (s-»words[i] != t-»words[i]) 
return 0; 
return 1; 


} 

Bit, leq th REM As RIt3t es SETI HFK, WRs Ct， 那么 对 s 中 的 每 一 个 值 为 1 
的 位 ,t 中 相应 的 位 都 为 1 ,按照 集 合 的 定义 ， 如 果 s 和 t 的 补 集 的 交集 为 空 ， 则 s ct, AH, 
如 果 s&&~t 等 于 零 ， 则 s Ci; 这 种 关系 在 s 和 t 中 的 每 个 无 符号 长 整 型 数 中 也 者 存在 - 如 果 对 于 
所 有 的 i ，s->u.words[i] Ct-»u.words[i], Mls St。 一 吕 知 道 了 输出 结果 ，Bit_leq 利 用 这 种 属 
性 立即 停 涉 比 较 ; 

(functions 203}= 


int Bit_leq(T s, T t) { 
int i; 


assert(s && t); 
assert(s-»length == t-»length); 
for (i = nwords(s-»length); --i >= 0; ) 
if (CG-»words[i]&-t-»words[i]) != 0) 
return 0; 
return 1; 
H 


如 果 s 是 t 的 一 个 子 集 ， 则 Bit_lt 返 回 值 是 1!; 如 果 s St 且 s 关 1， 则 有 s Ct， 这 尽 通 过 确保 
s-»u.words[i]&-t —u.words[i] HE IAAL A -Ps—pu.words|i] 528 FA wi lyt->u.words[i] 





(functions 203}= 
int Bit It(T s, T t) í 
int i, lt = 0; 


assert(s && t); 
assert(s-»length == t-»length); 
for (i = nwords(s-»length); --i >= 0; ) 


if (CG-»words[i]&-t-»words[i]) !- 0) 
return 0; 
else if (s->words[i] != t->words[i]) 
It l= 1; 
return lt; 


} 
13.2.3 集合 操作 


实现 集合 操作 s+t、sx*t、s-t 利 s At 的 函数 可 以 一 次 处 理 -个 长 整 型 换 作 数 ， 央 为 这 些 函 
数 的 功能 着 独立 十 位 序号 的 .这些 琢 数 也 把 空 T 春 作 是 -- 个 空 的 集合 ， 位 是 s 和 tt 中 的 一 个 集 
合 必须 非 空 ， 以 便 函 数 决定 结果 的 长 度 . 这 些 函数 有 相似 的 实现 代码 、 除 了 布 三 个 处 更 的 不 
同 之 处 : st 指向 同 个 集合 时 的 辣 果 、 它 们 对 空 参 数 进行 的 操作 和 它们 怎样 为 摧 个 非 袍 集 
合 形成 结果 -。 代码 处 理 的 相似 性 可 以 通过 定义 宏 setop 米 实现 : 
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(macros 203)+= 
#define setop(sequal, snull, tnull, op) \ 

if (s == t) { assert(s); return sequal; } X 

else if (s == NULL) í assert(t); return snul7; ) \ 

else if (t == NULL) return tnull; \ 

else {\ 
int i; T set; N 
assert(s-»length == t-»length); X 
set = Bit new(s-»length); Ñ 
for (i = nwords(s-»length); --i >= 0; ) \ 

set-»words[i] = s-»words[i] op t-»words[i]; Ñ 

return set; } 


Bit unionfCK f xt +E RR: 
(functions 203)+= 


T Bit union(T s, T t) í 
setop(copy(t), copy(t), copy(s), |) 


ORs AUER Pe] — PE, UTE RR RA KEA A Oh se ee E BD 
311] WAS MERA AW EIA. AW. 函数 执 行 结 果 吕 一 个 集合 ， 该 集合 的 无 符 导 长 整 型 值 











As Ath AY SAF Eat LR WR Gr Bc, 
私有 函数 copy 分 配 一 个 新 的 与 参数 长 度 相同 的 集合 并 从 它 的 参数 里 复制 位 ; 
(static functions 212)- 


static T copy(T t) { 
T set; 


assert(t); 
set = Bit new(t-»length); 
if (t-»length > 0) 
memcpy(set->bytes, t-»bytes, nbytes(t-»length)); 
return set; 


} 
如 果 它 的 任何 “个 参数 为 空 的 话 ，Bit_inter 将 返回 一 个 空 的 集合 ; 否则 ， 它 返回 一 个 操 
作 数 按 位 取 与 的 集合 : 
(functions 203)+= 
T Bit_inter(T s, T t) í 
setop(copy(t), 
Bit_new(t->length), Bit_new(s->Jength), &) 
} 
BRS BE, Ws -+t E SRA, ARS, s — t Es. MRS HUS AEZ, 
8 - tS MEOH HEIL S, Ms 和 t 足 相同 的 Bit_TH 时 ，s ~-t 是 -个 空 集 - 
(functions 20342 
T Bit_minus(T s, T t) { 
setop(Bit new(s-»length), 
Bit new(t-»length), copy(s), & ~) 
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setop 的 第 三 个 参数 && ~ 导致 的 循环 休 足 : 

set-»words[i] = s->words[i] & ~t->words[i]; 

Bit diff Ka f IR Æ. His stas, sitik MEA. MRSA, s/t He Ft, 
反之 内 


{functions 203)+= 
T Bit diff(T s, T t) { 
setop(Bit new(s-»length), copy(t), copy(s}, A) 





} 
如 上 所 示 ， 当 s 和 和 t 沸 向 同一 个 Bit_T 时 、s /1 为 裕 
参考 书目 浅 析 


Briggs 和 Torczon (1993) 描述 了 一 个 集合 的 表示 方法 EAE UD CK RO, RARES, 
JET LATE BU RUM TF 4n f Ae fp. Gimpel (1974) 中 入 了 空间 多 抑 集 合 ， 练 习 13.5 将 对 
此 进行 描述 。 


练习 


13.1 ERARA, ARAL ESO. 修改 Bit 的 实现 ， 通 过 AA AIK RO Jú 
KUTAR T A M EOR 

13.2 设计 一 个 搂 已 ， 使 之 能 支持 Briggs ATorczon (1993 ) 描述 的 稀 搞 人 折合 ， 并 实现 该 按 口 。 

133 Bit_set 几 循环 
for (i = 10/8+1; i < hi/8; i++) 

set->bytes[i] = OxFF; 
来 设置 从 字 节 lo “8+1 到 hi /8 的 所 有 比特 位 。Bit OMM 相似 的 循环 。 
如 果 可 能 ,修改 这 些 循环 对 无 符 导 长 整 型 数 进 行 清除 、 设 兽 和 取 与 运算 ， 而 不 是 
对 季节 进行 操作 。 你 能 找到 一 个 能 在 执行 期 辣 出 现 可 度 eins 能 改善 的 应 用 上 吗 ? 

13.4 ”假定 Bit 函 数 跟 冻 一 个 集合 中 的 值 为 1 的 比特 数 . Bit 顺 数 能 简化 或 者 改 葵 什么 ” 实 
现 这 个 想法 并 设计 -- 个 测试 程序 来 确定 提高 的 性 能 质 景 。 说 明 在 什么 条 件 下 值得 
付出 - - 定 的 代价 来 多 Mn 的 好 处 ? 

13.5 在 一 个 补 间 多 元 集合 (spatially multiplexed set ) 中 ， 比 特 摧 字 人 存储- 在 32 位 整 型 
计算 机 上 ， -个 带 有 N 个 无 符号 整 型 的 数组 可 以 保存 32 个 N- 比 特 的 集合 ， 数 组 的 
每 个 只 含 1 比特 位 的 列 都 是 一 个 集合 ， 一 个 只 设置 了 比特 i 的 32 位 的 扼 代 能 识别 出 

人 i 的 集 仓 。 六 种 表示 方法 的 优点 足 只 执行 这 些 掩 码 就 本 以 在 固定 的 时 间 内 完成 一 
HERE. 例如 ， 对 二 两 个 集合 的 合集 ， 匠 推 码 就 是 两 个 执行 合集 操 千 的 集合 俺 码 

合集 。 许 多 N- 比 特 的 集合 前 可 以 共享 一 个 N- 字 的 数组 ,分 配 一 个 新 的 集合 也 就 
是 在 数组 中 分 本 个 自由 列 ， 这 种 顾 性 可 以 节省 空 癌 们 给 存 镶 管理 增加 了 相当 的 

复杂 度 ， 央 为 实 岗 必须 跟踪 这 个 N- 字 的 数组 ， 该 数组 具有 六 位 的 任 位 秆 的 自 而 列 ， 
用 这 和 神 方法 重新 实现 Bit;， 如 昌 震 要 强制 改 杰 接 11， 则 重新 设计 OB. 
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第 14 章 8 式 化 


标准 C 库 两 数 printf 、fprintf 利 vprintf 格 式 化 输出 数据 ，sprintf 和 vsprintf 将 数据 格式 化 到 
字符 中 中 。 这 些 函 数 同一 个 格式 化 字 答 中 和 一 个 参数 列表 一 起 被 调用 ， 这 个 参数 列表 中 的 值 
将 被 格 成 化 。 格 式 化 足 山 插 入 到 字符 中 的 形式 为 %c 的 转化 说 明 符 (conversion specifier ) 控 
市 的 。%e 的 第 i 次 出 现 将 描述 如 何 格式 化 参数 列表 中 贡 第 i 个 参数 ， 参 数列 表 在 格式 字符 中 后 
面 。 市 其 他 的 宁 符 被 逐 字 复制 - 例如， 如 凡 name 是 宁 符 串 “Array”，count 为 8， 则 





sprintf(buf, "The Xs interface has Xd functions\n", 
name, count) 


用 字符 串 “The Array interface has 8 functions\n” Ja ¥buf, Het wis Bei, HR 
符 也 可 以 包含 宽度 、 精 度 和 填充 规范 (padding specification )。 例 如 ， 在 上 而 的 格式 字符 中 
PHARE dA EE “The Array interface has 000008 functionswm ”填充 buf , 

这 些 函 数 虽然 非常 有 用 ， 但是， 至 少 有 四 个 缺点 : 第 一 ,转换 涪 明 符 的 设置 是 周 定 的 ， 
没有 办 法 来 提供 基 十 容 户 调用 程序 的 代码 ; 第 二 ， 被 格式 化 的 结果 只 能 在 字符 串 中 被 打印 或 
痢 任 储 ， 没 有 办 法 定义 一 个 基于 客户 调用 程序 的 输出 称 序 ; 第 一 个 也 是 最 危险 的 一 个 缺点 是 
sprintf fllvsprintf oj 能 试图 输出 比 它们 所 能 存储 的 字符 绅 更 多 的 字符 ， 没 有 方法 规定 输出 字符 
品 的 大 小 ; 最 后 ,对 在 参数 列表 的 变革 部 分 传递 的 参数 无 法 进行 稳 式 检查 ，Fmt 接 口 解决 


B= MLA. 





14.1 接口 
Fmt 接 上 1 有 11 个 的 数 ， -种 类 型 、 一 个 必 虽 和 一 个 异常 : 


(fmt.hy= 
#ifndef FMT_INCLUDED 
#define FMT_INCLUDED 
#include <stdarg.h> 
#include <stdio.h> 
#include "except.h" 


#define T Fmt T 
typedef void (*T)(int code, va_list *app, 
int putCint c, void *cl), void *cl, 
unsigned char flags[256], int width, int precision); 


extern char *Fmt_flags; 
extern const Except_T Fmt_Overflow; 
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(exported functions 216) 
#undef T 
#endif 
从 技术 上 进 ，Fmt 不 足 -- 个 抽象 数据 类 型 NEE ANS EP mt_T ， 此 类 型 定 
义 了 与 每 种 格式 化 代 友 相 关联 的 格式 转化 函数 的 类 型 ， 下 面 允 详 细 介 绍 


14.1.1 格式 化 函数 


F Bi ACY Fb 3525 0946 AER RA ; 


(exported functions 216)= 
extern void Fmt fmt (int put(int c, void *cl), void *cl, 
const char *fmt, ...); 
extern void Fmt vfmt(int put(int c, void *cl), void *cl, 
const char *fmt, va list ap); 


Fmt_fmt 根 据 第 = 个 参数 fmt 给 定 的 格式 字符 中 来 格式 化 它 的 第 四 个 及 以 后 的 参数 ， 并 调用 
put (ç, cl) 米 给 出 等 个 已 经 格式 化 的 字符 c; c 被 当 作 无 符号 字符 。 内 此 传递 给 put 的 值 始 终 
为 止 。 Fmt_vfmt 根 据 格式 化 字符 由 来 格式 化 ap 指 向 的 参数 ， 该 格式 化 字符 汕 册 fmt 给 定 ， 做 
法 同 下 面 所 讲 的 Fmt_fmt 类 做。 

参数 cl 可 以 指向 客户 调用 程序 提供 的 数据 、 它 仪 仅 不 作 解 释 地 被 传递 到 客户 调用 程序 的 
PUL. put 函数 返回 -个 蓝 胡 值 ， 通 党 是 它 的 参数 ，Fmt 函 数 人 不用 这 种 方法 ， 但 是 该 设计 
允许 在 某 些 机 器 上 当 FILE* 被 当 作 cl 来 传递 时 ， 把 标准 LO 也 数 fpute 当 作 put 活 数 来 用 。 例 如 ， 


Fmt fmt((int (*)Cint, void *))fputc, stdout, 
"The Xs interface has Xd functions\n”, name, count) 


name 是 Array 、count 为 8 时 ， 在 标准 输出 上 输出 

The Array interface has 8 functions 

类 型 转换 是 必需 的 ， 因 为 fputc 有 int(*)(int,FILE*) 型 ， 而 put 有 int(*)(int,void*) 型 。 这 种 
用 法 只 有 在 FILE 指 针 有 与 一 个 空 指针 相同 的 表示 方法 时 才 正 确 . 

网 14-1 所 示 的 语法 表 定 义 了 转 才 说明 符 的 请 法 、 在 转换 说 明 符 中 的 字符 定义 了 一 条 通过 
这 张 图 的 路 径 ， 有 效 的 说 明 符 从 开 治 到 结束 走 完 路 径 . 一 个 说 明 符 从 a% 开始 ， 后 面 是 可 选 
的 标志 字符 ， 其 解释 依赖 于 格式 化 代码 ， 可 选 的 域 为 ; 宽度、 周期 和 精度 ; 并 以 -个 单个 字 
符 的 格式 化 代码 米 结束 、 如 图 14-1 中 的 C 所 表示 的 奢 样 有效 的 标志 符 是 那些 出 现在 
Fmt_flags 指 向 的 字符 中 中 的 字符 它们 通常 定义 了 对 齐 (justification )、 补 足 ( padding ) 
FIRI ( truncation ), 如 果 - 个 标志 字符 在 一 个 说 明 符 中 出 现 次 数 超过 255 次 ， 则 会 产生 可 
检查 的 运行 期 错 刘 。 如 果 星 导出 现在 宽度 域 和 精度 域 . 则 下 一 个 参数 被 假定 为 整 型 并 用 于 宽 
度 域 和 精度 域内 此 ,一 人 说 明 符 可 以 使 用 任意 多 个 参数 ， 这 依赖 于 是 否 有 旺 导出 现 和 与 格 
式 化 代码 相关 联 的 特殊 的 转换 虎 数 如 果 宽 度 或 者 精度 定义 的 值 等 于 INT_MIN- £o 
负 整数 时 ， 则 会 产生 可 检查 的 运行 期 错误 。 
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# 式 化 
Specification: „>= number - -. 
—flags number- >. '—— 
C NS BU l 
"t ——- ” : — Cc 
number: 
~ en 
_! (diet — 
| 
— digit —— —9—————' 


图 14-1 转换 说 明 符 语法 


标志 、 宽 厦 和 精度 的 详细 说 明 依 束 于 与 转换 说 明 符 相关 联 的 转换 函数 、 这 些 函数 宰 几 是 
那些 在 调用 Pmt_fmt 时 注册 的 函数 。 

忽 省 的 转换 说 明 符 和 与 它们 相关 联 的 转换 函数 部 是 慰 准 1/0 库 中 的 printf 函 数 及 相关 函数 
WFR, Fmt flags 的 初始 值 指向 字符 中 “- + 0”， 因 此 ， 这 些 字 符 足 丰 效 的 标志 符 ,“-” 使 
被 转换 的 宁 符 串 在 给 定 的 宽度 里 向 左 对 其 《left-justified 上 “+ ”代表 一 个 从 “- ”或 者 “4” 

开始 的 有 符号 的 转换 的 结果 。 空 格 “” 表 水 为 丰 时 从 裕 格 本 始 的 有 符 叶 转换 的 结果 。0 表 示 
数字 转换 ， 用 洪 零 的 方法 专 充 战 ， 否 则 将 使 用 太白。 -个 负 值 的 宽度 带 有 标点 “-” 和 相应 
的 正 值 的 宽度 。 精 度 为 负 被 认为 没有 给 定 精度 ， 

在 表 L4-1 中 列 出 缺 省 的 转换 说 明 符 。 这 些 转 换 说 明 符 足 定义 在 标准 C 库 竺 的 说 明 符 的 子 集 。 

下 述 两 数 同 C 库 函数 printf 、fprintf ，sprintf 利 vsprintf 类 似 ， 








(exported functions 216)+= 
extern void Fmt print (const char *fmt, ...); 
extern void Fmt. fprint(FILE *stream, 
const char *fmt, ...); 
extern int Fmt sfmt (char *buf, int size, 
const char *fmt, ...); 
extern int Fmt vsfmt(char *buf, int size, 
const char *fmt, va list ap); 


Fmt -fprint 根 据 fmt 给 定 的 格式 化 字符 串 来 格式 化 第 一 个 及 其 后 的 参数 并 把 它 的 已 经 格 
式 化 的 结果 写 到 标准 输出 中 

Fmt_sfmt 根 据 fmt 名 ———Év 并 将 这 些 结 果 作 
为 一 个 以 空 字 符 为 结束 标志 的 字符 串 存储 在 buf ` 0..size—1 ] 中。Fmt_vsfmt 5 比 类 似 ， 只 是 
它 从 可 变 长 度 参数 列表 的 指针 ap 中 获得 参数 。 这 两 个 两 数 都 返回 存储 在 buf 中 的 字符 数 
东 符 不 计算 在 内 。 如 果 Fmt_sfmt 和 Fmt_vsfmt 给 出 超过 size 个 字符 ( 包含 结束 符 }， 则 它 个 | 将 
引发 异常 Fmt_Overflow ， 如 果 size 非 止 ， 会 产生 可 检查 的 运行 挫 错 误 。 

F PS eee 


(exported functions 216)+= 
extern char *Fmt_string (const char *fmt, ...); 
extern char *Fmt vstring(const char *fmt, va list ap); 


i 





218 





162 HUE 





flFmt_sfmt flFmt_vsfmt% fl, BE TRE 7 BU Ie UE K hi SE TEHN 2 RET a Jul ik B Ay 
出- 客户 调用 程序 负责 释放 它们 Fmt_string #Fmt_vstring ABA) 能 引发 Mem_Failed , 
将 一 个 空 的 put 、buf 或 者 fmt 传 递 给 1- 面 的 孝 些 格式 化 晒 数 帮 将 导致 运行 时 出 现 检测 错误 - 


14.1.2 转换 函数 
每 个 格式 字符 C 都 与 转换 函数 树 关联。 这 些 联系 可 以 通过 调用 下 而 的 函数 来 收 变 ; 


(exported functions 216)+= 
extern T Fmt register(int code, T cvt); 


Fmt register evt, fF Ath code fi (BU WX FFF th y Fete oH, 3ËjE oU RE BOUE 
针 。 内 此 客户 调用 程序 可 以 暂时 忽略 转换 函数 ， 然 后 再 恢复 先前 的 函数 。 如 果 code 小 于 0 或 
者 大 于 255 则 会 产生 可 检查 的 运行 期 错误 ， 如果 格 式 字符 帅 俩 用 没有 与 格式 化 两 数 相 关联 的 
转换 说 明 符 也 会 产生 可 检查 的 运行 其 错误 。 

许多 转换 函数 部 是 使 用 %d 利 名 转换 说 明 答 的 数 数 的 变种 。Fmt 导 出 项 个 实 败 丽 数 ， 该 
函数 被 它 的 内 部 的 数字 和 字符 串 转 换 范 数 使 用 - 

(exported functions 216)+= 

extern void Fmt_putd(const char *str, int len, 
int put(int c, void *c]), void *cl, 
unsigned char flags[256], int width, int precision); 
extern void Fmt puts(const char *str, int len, 
int put(int c, void *cl), void *c1, 
unsigned char flags[256], int width, int precision); 
FEmt_putd 假 定 str [0..len -1] PA —4 AS BUN FFE ARIE, 并 根据 转换 来 发 送 字符 中， 
其 中 转换 是 出 表 14-1 小 描述 的 qd 的 flags 、，width 和 precision 玉 定义 的 .类似 地 ，Fmt_puts 也 
根据 表 14-1 中 描述 的 名 s 的 flags width 和 precision 定 义 转换 来 发 送 字 符 册 ,将 -个 空 的 str、 
一 个 负 的 ten 、 一 个 空 的 flags 战 者 … 个 空 的 put 传 递 给 Fmt_putd 或 闪 Fmt_puts 部 会 产 牛 可 检查 


的 运行 期 错误 。 





表 14-1 缺 省 的 转换 说 明 符 




















HEN SIRE LEES 
cinta BRB ATE S FAKK DR 
dintid est HU AT Y HEADER. E HET LC. ME OR Roa. WRES 
ñB Duct, Benin AEE u a "07 dg 3 
忽略 “0” 标 志 。 如 果 "e" irs Hed L 则 忽 
购 在 转换 结 玉 中 没有 宁 符 

ou x unsigned 型 参数 被 转换 成 上 符号 型 的 8 进 制 (o). 十进制 (u) ok LORE OO MER. AI TIGER. 

超过 9 的 数 将 用 abedef AVE k UR 标志 和 粮 度 的 说 中 Nd 中 标志 和 精 座 的 说 明 类 似 。 
f double if 该 参数 被 转 欣 成 | MEAL DATA ”精度 给 出 了 小 数 点 右面 的 数值 的 位 数 ， 缺 省 为 6. 


AUR SA GIMINDECOSCE, MIARE. NUR do. Maebh -位 数 ， 精 度 超过 
9925 A RUA PENS FTES nah ARG (P BLU bd bs d 和 精度 的 说 有 类 似 - 
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GR) 
MEH 参数 类 型 描 述 
€ double X 该 参数 被 转化 成 十 进 制 x.ye +p ERER, 具 中 x 总 是 一 位 数 而 p 总 是 蜀 位 数 。 标 志和 精 
变 的 说 明 三 中 标志 和 精度 的 说 四 类 似 : 
g double 再 VER RNC Wii kt Ee VAR SAA. HORA 2 如果 P 小 于 -4 或 


者 大 十 等 于 精度 ， 则 结 米 写成 ye tp 的 表示 形式 ;再 则 瑟 成 x.y 的 形式 ,y 后 而 没有 零 ， 如 
Ry BE, WAR TRAM - WE IIe 可 检查 的 运行 期 绍 识 、 
p vod * VS ROME H tB TREMPER OE EE B UL of d epis BF 0548128 A 
s char * KA eRe £: TSR RIL, BBN AATE RENA tE ATT TIERE 
SRC b. EWER ^-^ JF, HAEA baa Eak B. 











Fmt_putd Fmt puts HATE RM, ARENT RE SOA. SORE KP: 
调用 程序 的 转换 函数 时 ， 它 们 是 最 有 用 的 。 下 面 将 进行 说 明 。 

Fmt TEX Y Pik A BUAE 44 (signature) —— BE BJ 参数 的 类 型 和 它 的 返回 类 型 。 转 
换 函 数 出 7 个 参数 来 调用 。 前 两 个 是 格式 化 代码 和 一 个 指向 可 变 长 度 参 数列 表 指针 的 指针 , 
其 中 参数 列表 指针 用 来 访问 要 被 格式 化 的 数据 ， 第 三 个 和 第 四 个 参数 是 客户 调用 程序 的 数据 
函数 和 相关 的 数据 。 后 三 个 参数 是 标志 、 域 的 宽度 和 精度 。 标 志 由 含 356 个 元 素 的 字符 数组 
来 给 定 ， 共 中 第 i 个 元 素 等 于 标志 字 答 在 转换 说 明 符 里 出 现 的 次 数 。 当 width 和 precision 没 有 
明确 给 定时 ， 等 于 INT_MIN 。 

转换 函数 必须 使 用 如 下 表达 方式 

va_arg(*app, type) 

RAGS BC, Tp Ut SO MUR 556 BUR B UK ao e Bio HAL. type 足 所 期 望 的 参 
数 类 型 。 该 表达 获得 参数 的 什 ， 然 后 增加 *app 以 便 指 向 下 一 个 参数 如 果 转 换 疼 数 错误 地 增 
加 了 *app， 则 会 产生 可 检查 的 运行 期 错误 - 

Fri (685 eos M AH Pei ER BORE F 16 HE SUR ER URL ERE b Fa Fmt. puts 。 说 明 符 %s 
类 似 守 printf 的 %s : 它 的 函数 发 送 字符 囊 中 的 字符 ， 直到 过 刘 空 字符 或 者 将 给 定 精 度 的 所 有 
FRE ABR IRIE Wk - ”标志 或 者 负 的 宽度 说 明 要 向 左 对 齐 (left-justification )。 转 换 函 数 
使 用 va_arg 从 可 安 长 度 参 数 询 表 中 取出 参数 ， 并 调用 Fmt_puts ; 

(conversion functions 222)= 

static void cvt s(int code, va list *app, 
int put(int c, void *c]1), void *cl, 


unsigned char flags[], int width, int precision) ( 
char *str - va_arg(*app, char *); 


assert(str); 
Fmt_puts(str, strlen(str), put, cl, flags, 
width, precision); 
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Fmt_puts fžflags , width #iprecision, J fU B) Ah APM: 
(functions 222)= 
void Fmt_puts(const char *str, int Jen, 
int put(int c, void *cl), void *cl, 
unsigned char flags[], int width, int precision) í 


assert(str); 
assert(len >= 0); 
assert(flags); 
(normalize width and flags 223) 
if (precision >= 0 && precision < len) 
222 Ten = precision; 

if (!flags['-']) 

pad(width - len, ' '); 
(emit str[0..1en-1] 223) 
if C flags['-'}) 

pad(width - len, ' '); 





} 


(emit str [0..1en-1] 223)= 
t 
int i; 
for (i = 0; d < Ten; i++) 
put((unsigned char)*str++, cl); 


IEPES SIE AE 4428 56 IUE RAR A put ROB BE DAY FARR .就 像 在 Fmt 的 
定义 里 规定 的 耶 样 。 


如 果 忽略 宽度 和 精度 ， 则 width 和 precision 等 于 INT_MIN 。 GGL AA TE PA PERE 
的 转换 函数 使 用 所 有 的 宽度 ( 被 明确 说 明 的 或 被 省 略 的 )、 精 度 和 重复 标志 的 组 合 提供 所 项 
的 灵活 性 ,但 是 缺 省 的 转换 不 沉 要 这 样 ， 它 们 把 所 忽略 的 宽度 当 作 0 宽 度 ， 把 负 觉 变 当 作 带 
有 “-” 标 志 的 相应 的 正 宽度 ， 把 负 的 精度 忽略， 把 重复 出 现 的 标志 看 作 只 出 现 一 次 等 。 如 


果 有 明确 的 精度 ， 则 忽略 0 标志 ， 并 月 ， 如 上 所 示 ， 和 于 多 有 precision 个 字符 从 stf 中 发 出 。 


(normalize width and flags 223)= 
(normalize width 223) 
{normalize flags 224) 


(normalize width 223)= 
if (width == INT_MIN) 
width = 0; 
3f (width < O) { 
flags['-'] = 1; 
width = -width; 
= } 
{normalize flags 224)= 
if (precision >= 0) 
flags['0'] = 0; 
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iEn a pad BT sig, BA IEwidth-len 4 Zs F& LA (E 801 at 7p drin : 


(macros 224)= 
#define pad(n,c) do { int nn = (D; Ó 
while (nn-- > 0) \ 
put((c), cl); } while (0) 
Pad 是 宏 定义 ， 因 为 它 要 访问 put 和 ci 


下 一 节 将 描述 其 他 缺 省 的 转换 函数 的 实现 。 





14.2 实现 


Fmt 的 实现 包括 在 接 凯 中 定义 的 哺 数 、 与 扶 认 转换 说 明 符 相 关联 的 转换 函数 和 将 转换 说 
明 符 映 射 到 转换 函数 的 表 。 


{fmt.c= 

#include «stdarg.h» 
#include «stdlib.h» 
#include <stdio.h> 
#include <string.h> 
#include <limits.h> 
#include <float.h> 
#include <ctype.h> 
#include <math. h> 
#include "assert.h" 
#include "except.h" 
#include "fmt.h" 
#include "mem.h" 
#define T Fmt_T 


(types 226) 





(macros 224) 224 











(conversion functions 222) 
(data 225) 

(static functions 225) 
(functions 222) 


(data 225)= 
const Except T Fmt Overflow = { "Formatting Overflow" ); 


14.2.1 格式 化 函数 


Fmt_vfmt 是 实现 的 核心 ， 因 为 所 有 其 他 的 接口 明 数 都 要 调用 它 来 完成 格式 化 。Fmt_fmt 
是 最 简单 的 例子 ， 它 初始 化 参量 列表 的 安 量 部 分 的 指针 va_list， 并 调用 Fmt_vfmt: 


(functions 222)+= 
void Fmt fmt(int putCint c, void *), void *cl, 
const char *fmt, ...) ( 
va list ap; 














FE 





166 
va_start(ap, fmt); 
Fmt vfmt(put, cl, fmt, ap); 
va_end(ap); 
H 


Fmt_print 和 Fmt_fprint 将 调用 Fmt_vfmt， 并 把 outc 当 作 Put 函 数 、 把 标准 输出 流 或 者 给 定 
的 流 当 作 相 关 数据 : 
(static functions 225)= 


Static int outc(int c, void *c1) í 
FILE *f = cl; 


return putc(c, f); 
} 


(functions 222)+= 
void Fmt print(const char *fmt, ...) ( 
va list ap; 
va start(ap, fmt); 
Fmt vfmt(outc, stdout, fmt, ap); 
va_end(ap); 


void Fmt fprint(FILE *stream, const char *fmt, ...) í 
va list ap; 


va start(ap, fmt); 
Fmt vfmt(outc, stream, fmt, ap); 
va end(ap); 


Fmt_sfmti Fi Fmt_vsfmt ; 


(functions 222)+= 
int Fmt sfmt(char *buf, int size, const char *fmt, ...) { 


va list ap; 
int len; 


va -start(ap, fmt); 

len = Fmt vsfmt(buf, size, fmt, ap); 
va end(ap) ; 

return len; 


) 
Fmt_vsfmt 用 Put 两 数 和 一 个 结构 指针 来 将 用 Fmt_vsfmt ， 其 中 结构 指针 跟踪 被 格式 化 进 


buf 的 宁 符 串 和 此 宁 符 串 所 带 有 的 宁 符 的 数 日 : 


(types 226)= 
struct buf { 
char *buf; 
char *bp; 
int size; 





1; 
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buf fülsize &Fmt_vsfmt AX (ih 2 0 SRA y, bp fi ibut P F — 4 86 RAK FR ET ME 
的 位 置 。Fmt_vsfmt 初 始 化 该 结构 的 一 个 局 部 实例 ， 并 将 它 的 个 指针 指向 Fmt_vfmt: 


(functions 222)4= 
int Fmt vsfmt(char *buf, int size, const char *fmt, 
va list ap) { 
struct buf cl; 


assert(buf); 
assert(size > 0); 
assert(fmt); 
Cl.buf = cl.bp = buf; 
cl.size = size; 
Fmt vfmt(insert, &cl, fmt, ap); 
insert(0, &c1); 
return cl.bp - cl.buf - 1; 
} 


十 面 对 Fmt_vfmt 的 调用 使 用 私有 函数 insert 和 每 个 要 发 送 的 字符 ,还 有 Fmt_vsfmt 的 局 
部 buf 结 构 指针 。insert 用 来 检测 是 否 有 容纳 字符 的 空间 ， 并 把 它 存 储 在 出 bp 域 给 定 的 位 置 ， 
然后 再 增加 bp 域 的 大 小 : 


(static functions 2258 
static int insert(int c, void *cl) { 
struct buf *p = cl; 


if (p->bp >= p->buf + p->size) 
RAISE(Fmt_Overftow) ; 

*p-»bper = c; 

return c; 


H 


Fmt_string 和 Fmt_vstring 有 有 类似 的 实现 方式 ， 只 是 它们 使 用 不 同 的 put 函 数 。 Fmt string 
要 调用 Fmt_vstring r£: 


(functions 222)+= 
char *Fmt string(const char *fmt, ...) í 
char *str; 
va_list ap; 


assert (fmt); 

va start(ap, fmt); 

str = Fmt vstring(fmt, ap); 
va_end(ap) ; 
return str; 


H 


Fmt_vstring 将 - buff WIS (L9 —^4- SETHR256 T (IU Sep He, HR eH 39038 
针 传递 给 Fmt_vfmt : 








226 
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(functions 222)+= 
char *Fmt vstring(const char *fmt, va list ap) í 
struct buf cl; 


assert(fmt); 

cl.size = 256; 

cl.buf = cl.bp = ALLOC(cl.size}; 

Fmt vfmt(append, &cl, fmt, ap); 

append(0, &c1); 

return RESIZE(cl.buf, cl.bp - cl.buf); 
} 


append 同 Fmt_vsfmt 的 put 函数 类 似 ， 只 旦 它 在 必要 时 ,能 将 空闲 的 字符 串 的 长 度 加 倍 ， 
以 便 能 容纳 更 多 格式 化 的 字符 。 


(static functions 225)+= 
static int append(int c, void *c1) í 
struct buf *p = cl; 


if (p->bp >= p->buf + p->size) { 
RESIZE(p->buf, 2*p-»size); 
p-»bp = p->buf + p-»size; 
p-»size *= 2; 

) 

*p->bp++ = c; 

return c; 

} 


当 完 成 Fmt_vstring 片 ， 出 but 域 指向 的 字符 中 可 能 太 长 了 ， 这 就 是 为 什么 Fmt_vstring 要 
调用 RESIZE 来 释放 超出 的 字符 的 原因 。 

WAR #JFmt_vfmt 了。 它 解释 了 佑 个 格式 化 字符 中 ， 并 为 每 个 格式 化 说 明 符 调用 适当 的 函 
数 ; 而 对 格式 化 字符 串 中 的 上 他 字符 ， 将 调用 put 函 数 ， 

(functions 222)+= 


void Fmt_vfmtCint putCint c, void *c1), void *c1， 
const char *fmt, va_list ap) { 


assert(put); 
assert(fmt); 
while (*fmt) 
if (fmt != '%' || *eefmt == '%') 
put((unsigned char)*fmt++, c1); 
else 


(format an argument 229) 


format an argument 229» | ifj Ky U fE E: E: Elflags , widthfüprecision, ， 并 处 理 转换 
说 明 符 没有 相应 的 转换 函数 的 可 能 性 。 在 下 曾 的 代码 中 ， 将 width 赋 给 宽度 域 ， 而 将 
precision lit 4& F tt, 


(format an argument 229)= 
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unsigned char c, flags[256]; 

int width = INT_MIN, precision = INT_MIN; 

memset(flags, '\0', sizeof flags); 

(get optional flags 230) 

(get optional field width 231) 

(get optional precision 232) 

€ = *fmt++; 

assert(cvt[c]); 

Ccvt[c])Cc, &ap, put, cl, flags, width, precision); 
H 


cvt 是 -个 指向 转换 函数 的 指针 数组 、 它 出 一 个 格式 化 字符 来 索引 。 在 DOR ICE, Rer UR 
为 一 个 无 符号 字符 ， 以 依 保 *fmt 被 解释 成 一 个 0 -255 之 问 的 整数 。 
候 定 按 ASCHI 码 排序 ， 则 cvt 被 初始 化 成 带 有 缺 省 转 岳 说 明 符 的 转换 函数 ， 


(data 22545 


static T cvt[256] = { 


fe 0 7*0 0, 0, 0, o, °, 0, 0, 
/* 8- 15 */ 0, 0, 0, 0, 0, 0, 0, 0, 
/* 16- 23 */ O, 0, 0, 0, 0, 0, 0, o, 
/* 24- 31 "/ 0, 0, 0, 0, 0, 0, 0, 0, 
/* 32- 39 */ 0, 0, 0, 0, 0, 0, 0, 0, 
/* 40- 47 */ 0, 0, 0, 0, 0, 0, 9, 9, 
/* 48- 55 */ Q, 0, 0, 0, 0, 0, 0, 0, 
/* 56- 63 */ 0, 0, 0, 0, 0, 9, 0, 0, 
/* 64- 71 */ 0, 0, 0, 0, 0, 0, 0, 0, 
/* 72- 79 */ 0, 0, 0, 0, 0, 0, 0, 0, 
/* 80- 87 */ 0, 0, 0, 0, 0, 0, 0, °, 
/* 88- 95 */ 0, 0, 0, 0, 9, 0, 0, 9, 
/* 96-103 */ 0, 0, 0, cvt c, cvt d, cvt f, cvt f, cvt f, 
/* 104-111 */ 0, 0, 0, 9, 0, 0, 0, cvt o, 
/* 112-119 */ cvt p, 0, 0, cvt s, 0, cvt.u, o 0, 
/* 120-127 */ cvt x, 0, 0, 0, 0, 0, 0, ü 


FEmt_register 通 过 将 一 个 指向 它 的 指针 存 鱼 到 cvt 适 当 的 元 索 中 的 方法 米 安装 -个 新 的 转 
REH. TEL UCE AEN: 


(functions 222)+= 
T Fmt_register(int code, T newcvt) í 
T old; 


assert(0 < code 
&& code < Cint)(sizeof (cvt)/sizeof (cvt[0]))); 
old = cvt[code]; 
cvt[code] = newcvt; 
return old; 


H 
THER TR LUE PEDIS FC GER HERI 14-1 rf t 
flags: 





法 ， 在 运行 时 增加 fmt 第 -个 说 明 符 使 用 











230 
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(data 225H= 
char *Fmt flags = "-+ 0"; 


(get optional flags 230)= 
if (Fmt flags) í 
unsigned char c = *fmt; 
for ( ; c && strchr(Fmt flags, c); c = *++fmt) í 
assert(flags(c] < 255); 
flags[c]++; 


} 
第 二 个 说 明 答 使 用 width: 


(get optional field width 231)= 
if (fmt == '*' || isdigit(*fmt)) { 
int n; 
(n € next argument or scan digits 231) 
width = n; 
1 


宽度 和 精度 中 可 以 出 现 星 号 ， 在 这 种 情况 下 ， 下 个 整 型 参数 将 提供 它们 的 值 。 


(n — next argument or scan digits 231)= 
if (fmt == '*') { 
n = va arg(ap, int); 
assert(n != INT_MIN); 
fmt++; 
} else 
for (n = 0; isdigit(*fmt); fmt++) { 
int d = *fmt - '0'; 
assert(n <= (INT MAX - d)/10); 
n = 10*n + d; 
} 


HEU RRT RIE, 4 — 42 ME OLE, BABES INT MIN ( 缺 省 
值 ) 如 果 要 明确 给 定 宽度 和 精度 ， 则 它们 不 能 超过 INT_MAX ， 即 约束 条 件 是 10  n+d = 
INT_MAX 亦 即 10 .n+d 不 能 溢出 。 该 测试 不 能 造成 溢出 ， 所 以 在 小 述 断 言 代码 中 又 重 
新 声明 了 约束 条 件 。 

















下 而 的 循环 声明 了 -个 渐进 的 可 选 的 精度 : 


(get optional precision 232) 
if (fmt == '.' && Cefmt == '*' || isdigit(*fmt))) ( 
int n; 
(n e next argument or scan digits 231) 
precision - n; 


1 
注意 : MR Š." JSI AE RL, MCE, Bef BOUE DR. 
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14.2.2 转换 函数 


Jos fr FEAR ore vt sc 14.1.2 HATA. cvt d Rd J ER ERR, E 
FERR EES. ORIG TEE fe TATE SES. PB 
"pm. WR ARORA CAS. PRE HM HPmt_putd fin ih FF As 


(conversion functions 222)+= 
static void cvt d(int code, va_list *app, 
int put(int c, void *cl), void *cl, 
unsigned char flags[], int width, int precision) { 
int val = va arg(*app, int); 
unsigned m; 
(declare buf and p, initialize p 233) 


if (val == INT. MIN) 

m = INT MAX + 1U; 
else if (val « 0) 

m = -val; 
else 

m = val; 
do 

*--p = m%10 + 'O'; 
while ((m /= 10) > 0); 
if (val < 0) 

“p= '-'; 
Fmt_putd(p, (buf + sizeof buf} - p, put, cl, flags, 

width, precision): 


) 


(declare buf and p, initialize p 233)= 
char buf(43]; 
Char *p = buf + sizeof buf; 
ovt ot RC AHS HAREM, R jAtom inta], Hf 93.2 fj. 
么 buf 有 43 个 字符 。 





(functions 2224 
void Fmt_putd(const char *str, int len, 
int put(int c, void *cl), void *cl, 
unsigned char flags[], int width, int precision) { 
int sign; 


assert(str); 

assert(len »- 0); 
assert(flags); 

(normalize width and flags 223) 
(compute the sign 233) 

{ (emit str justified in width 234) ) 


AIG AIAN fs fei 
缓冲 区 中 产生 一 个 


AR BARR Y y F 








232 














233 
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Fmt_putd 必 须发 送 由 flags , width 和 precision 定 义 的 sr 中 的 字符 中 。 如 果 给 定 精 度 ， 则 
CELT ROME asüscrmec t EC SHEMET HRM, KTR ER EM MHS. 
Fmt putd 先 确定 是 否 需 要 -个 标记 战 者 在 前 面 补 至 ， 然 后 再 给 亏 个 字符 没 兽 sign: 


(compute the sign 233)= 


if Cen > 0 && (*str == '-' || *str == '+')) { 
sign = *str++; 
len--; 


Y else if (flags['+']) 
sign = '«'; 

else if (flags[' ']) 
sign = ' '; 

else 
sign = 0; 


#E<compute the sign 233> Vif it’s) JNAJESCER f +” 标记 优先 于 空格 标记 的 规则 。 转 换 结 
果 的 长 度 n 取 决 于 精度 、 补 转换 的 值 和 慰 记 : 


(emit str justified in width 234)= 

int n; 

if (precision < 0) 
precision = 1; 

if Clen < precision) 
n = precision; 

else if (precision == 0 && len == 1 && str[0] == '0') 
n= 0; 

else 
n = len; 

if (sign) 
net; 


n 是 要 传送 的 宁 符 数 , 该 段 代码 处 理 零 值 在 零 精度 情况 下 的 转换 ， 在 这 种 情况 下 ， 不 输出 转 
换 后 的 结果 中 的 字符 。 

如 果 笨 出 是 左边 对 齐 的 ， 则 Fmt_putd 可 以 发 送 标 记 ， 否则 ， 如 果 输 出 是 左面 补 零 右边 对 
齐 ， 则 Fmt_putd 发 送 林 记 和 实际 的 值 ， 如 果 输 出 是 左面 补 宗 格 右面 对 并 ， 则 Fmt_putd 发 送 实 
际 的 值 和 标 


(emit str justified in width 234}4= 

if (flags['-']) í 
(emit the sign 234) 

} else if (flags[’0']) í 
(emit the sign 234) 
pad(width - n, '0'); 

} else { 
pad(width - n, ' '); 
(emit the sign 234) 






H 


(emit the sign 234)= 
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if (sign) 
put(sign, cl); 


Fmt putd | LA 5686 UE 3E £6 Bs EGR. WR AE TOE, UT AE, MR Ah 


是 左 对 齐 的 ， 则 只 包括 实际 的 值 - 


{emit str justified in width 234}= 
pad(precision - len, '0'); 
(emit str [0..1en-1] 223) 
if (flags['-']) 

pad(width - n, ' '); 


cvt ul£evt dE (EI, fl EE: (EA Pmt_putd TT WL Ail SER DERE BASE HR. CETE 


符号 整 型 发 送 十 进 制 EKER: 


(conversion functions 222)+= 
static void cvt_uCint code, va_list *app, 
int putCint c, void *c1), void *cl, 
unsigned char flags[], int width, int precision) { 
unsigned m = va arg(*app, unsigned); 
(declare buf and p, initialize p 233) 


do 
*--p = m%ł0 + '0'; 
while (Cm /= 10) > 0); 
Fmt putd(p, (buf + sizeof buf) - p, put, cl, flags, 
width, precision); 
i 


八进制 和 上 六 进 制 的 转换 同 无 符号 小 进 制 转 换 类 似 ， 只 是 输出 底数 不 同 ， 它 简化 了 转换 


48. 


(conversion functions 2224 
static void cvt_o(int code, va list *app, 
int put(int c, void *c1), void *cl, 
unsigned char flags[], int width, int precision) { 
unsigned m = va_arg(*app, unsigned); 
(declare buf and p, initialize p 233) 


do 
*--p = (m&0x7) + '0'; 

while ((m >>= 3) != 0); 

Fmt_putd(p, (buf + sizeof buf) - p, put, cl, flags, 
width, precision); 


) 


static void cvt x(int code, va list *app, 
int putCint c, void *c1), void *c1， 
unsigned char flags[], int width, int precision) { 
unsigned m = va arg(*app, unsigned); 
(declare buf and p, initialize p 233) 








234 

















236 
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(emit m in hexadecimal 236) 


} 


(emit m in hexadecimal 236)= 
do 
*--p = "0123456789abcdef"[m&Oxf] ; 


while (Cm >>= 4) != 0); 
Fmt putd(p, (buf + sizeof buf) - p, put, c], flags, 
width, precision); 


evt pA TAB ETE PE, Ix HELL NUR E AUR "OPA E. SOLE, 
并 且 把 它 转换 成 -个 无 符号 长 整 型 数 ， 然 后 在 该 指针 中 进行 转换 , PROS JOE SUR i 空间 不 
会 大 于 指针 。 


(conversion functions 222)+= 
static void cvt p(int code, va_list *app, 
int putCint c, void *cl), void *cl, 
unsigned char flags[], int width, int precision) { 
unsigned long m = (unsigned long)va arg(*app, void*); 
(declare buf and p, initialize p 233) 


precision = INT. MIN; 
(emit m in hexadecimal 236) 


} 
evt c 5 %c TAK WKH ERR TC, NERF, width SEPARE [Jr 3t 
CANET ABBE CB ERS. 


(conversion functions 222)4= 
static void cvt.c(int code, va list *app, 
int putCint c, void *c1), void *C, 
unsigned char flags[], int width, int precision) { 
(normalize width 223) 
3f C!flags['-']) 
pad(width - 1, ' '); 
put((unsigned char)va_arg(*app, int), cl); 
if ( flags['-']) 
pad(width - 1, ' '); 


cvi cikit -PEATATI ATES BH RU E MUT HB TT BRET e £ 
SURE FL WRH (SORE TA HORE. ovt cH Mea Rat Haat — 1X PESE TTL ETTA 
的 、 无 符号 的 和 无 格式 的 字符 邦 能 以 相同 的 方式 发 送 . 

要 以 独立 于 机 器 的 方式 将 一 人 数 转 换 成 精确 的 十 进 制 数 症 很 困难 的 ， 基 于 便 件 的 算 
法 更 快 也 更 精 编 ， 基 此， 与 6 、f 和 g 等 转换 说 明 符 相 关联 的 转换 是 数 用 下 面 的 代 倘 将 val 的 绝 
对 值 转化 到 buf 中， 然后 后 发 送 buf， 








(format a double argument into buf 237)= 
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static char fmt{} = "%.dd?"; 
assert(precision <= 99); 

fmt[4] code; 

fmt[3] precision%10 + 'O'; 

fmt -2] (precision/10)X10 + '0'; 
sprintf(buf, fmt, va arg(*app, double)); 


} 

PE a FR fa MIT 2 I] At e T E ia FH eB de T ERR. eR nut Ue 
Ej LER FP %.99F, RI ERPEDBL MAX 10 EXP+1+1+99+1 Ff- DBL_MAX_10_EXP f 
DBL_MAX 是 在 标准 头 文件 float.h pag X is DBL MAX E BE H SUR E de s BO cU E. 
DBL MAX 10 EXPZMogiDBL MAX. Bx RHEA TOUR HERE Beas UE RAY e ER Gr 
数 。 对 于 在 IEEE 754% xt T 00 64 FE T G TE 6. DBL MAX 3 1.797693 x 10995, 
DBL MAX 10 EXP 5/308 , fmt [2] 和 fmt [3] K MUH ETR RASCH 排序 序列 进行 - 

因此 ， 旭 果 DBL_MAX 被 转化 成 转换 说 明 符 多 99f90: JJ BU AR. DU SS adt he Sa 
的 DBL_MAX_10_EXP+1 位 数 、 小 数 点 、 小 数 点 后 99 位 数 和 一 个 空 的 结 采 符 。 将 精度 限制 在 
99 即 是 限制 了 容纳 转换 结果 ! 缓 证 区 的 人 小 . 并 使 之 在 编译 时 能 被 识别 .来自 其 他 转换 
说 明 符 %e 和 %g 的 转换 结果 ， 比 %f 的 结果 所 带 的 字符 要 少 、cvi_f 处 理 所 有 这 二 部 分 的 代码 
如 下 : 





(conversion functions 222)+= 
static void cvt f(int code, va list *app, 
int putCint c, void *c1), void *c1, 
unsigned char flags[], int width, int precision) í 
Char buf[DBL MAX 10 _EXP+1+1+99+1]; 


if (precision « 0) 
precision = 6; 

if (code == 'g' && precision == 0) 
precision = 1; 

(format a double argument into buf 237) 

Fmt putd(buf, strien(buf), put, cl, flags, 
width, precision); 


参考 书目 浅 析 


Plauger (1992 ) HHE S C Fr PR printfáó tie CREUSE BE. 包括 将 字符 中 转换 成 淫 点 
型 值 或 将 浮 点 型 值 转换 成 字符 中 出 值 的 虐 层 代 侗 。 它 的 代码 也 显示 了 怎 伴 实现 其 他 的 printf 
风格 的 格式 化 标志 和 和 代码。 

Hennessy 和 Patterson (1994 ) 中 第 4.8 节 描述 [IEEE 754 浮 点 标准 和 浮 点 型 加 法 和 柔 法 
的 实现 ，Goldberg (1991) 全 究 了 程序 员 虐 关心 的 浮 点 地 算术 的 属性 。 

浮 点 型 转换 已 经 被 实现 了 很 多 次 ， 们 是 出 于 它们 很 容易 变 得 不 精确 或 者 太 悍 ， 从 而 需要 
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PERE th. AE RG eR Pe RUE ARGE R A, MA E — F FE, 
MiA ARRATE dup dp: py Lie Heft $C. Clinger (1990) fig ( 6 REA MESE 
现 答 人 转换 ， 还 描述 了 对 十 一 些 x 的 什 意 精度 的 转换 算法 。Steele 和 White (1990) 描述 了 怎 
样 实现 一 个 精 彤 的 输出 转换 、 


练习 


14.1 Fmt_vstring 使 用 RESIZE 来 释放 挨 回 的 字符 申 中 不 使 用 的 部 分 。 设 计 一 种 方法 ， 使 
得 可 以 只 有 在 值得 释放 的 时 候 4 完 成 释放 ， 即 当 所 释放 的 空间 值得 为 释放 它 所 付 
出 的 代价 时 才 完 成 释放 。 

14.2. 使 用 Steele 和 Wbite (1990 ) 中 搞 述 的 算法 ， 实 现 e 、f 和 g 的 转换 

14.3 和 写 一 个 转换 函数 ， 它 带 有 米 自 下 一 个 整 型 参数 的 转换 说 明 符 ， 并 将 它 利 字符 @ 相 
关联 。 例如; 
Fmt_string("The offending value is %@\n" , 

x.format, x.value); 

HERR dex format + B PEM He CE RTS 3648 st fkx.value 。 

144 GARE R, RRM RU IB THIER, EIE BUG F8 AU AH 08e A 
tB. H, 132-45 68 70-71 , 


第 15 章 ”低级 字符 审 


C 本 质 上 不 是 处 理 字符 遇 的 语 吉 ,但 是 它 确实 包含 处 理 字 符 型 数组 的 .[ 上 内 ,通常 这 
符 型 数组 被 称 为 字 e REH., -个 N 字 符 的 字符 品 就 足 一 个 N+1 个 字符 申 的 数组 
中 第 N+1 个 字符 是 空 字符 ， 即 它 的 值 为 零 。 

C 语 言 汪 身 只 有 两 个 用 米 处 理 字符 出 的 特性 。 字符 指针 可 以 用 来 移动 字符 数组 ， 并 且 字 
符 串 可 以 用 来 初始 化 字符 数组 。 例 如 ， 








char msg[] = "File not found"; 
是 
char msg[] = í 'F', ‘i’, "1', $17, tnt, 'o', 't', 
C. Fy tot, tut, tn’, "0 J; 
BY REE Hh. ERP, APR, LEA» "FT. — nu S ROIS, iE MA 


sizeof "F' ¥+sizeof (int) 的 原因 。 
ATE hat, AAR SP RESET IU) a ER n. jan, 
char *msg = "File not found"; 
等 价 于 
static char t376[] = "File not found"; 
char *msg = t376; 
FFB 76 Fb Hi 88 PE HE UAE HOT BBE, - 
在 任何 可 以 用 只 读数 组 名 的 地 方 部 可 以 使 用 字符 串 ， 例 如 ，Fmt 的 cvt_x 在 下 面 的 表述 中 
EATER: 
do 


*--p = "0123456789abcdef" [m&Oxf] ; 
while ((m >>= 4) !- 0); 


RE OF FH IT HRE: 


t 
static char digits[] = "0123456789abcdef"; 
*p++ = digits[m&Oxf]; 

} 


Ah, digits ER IEE SLT T. 
C 库 函数 包含 -HAERA TE R SPARE hg Re Pj 数 在 慰 准 头 文件 string.h 
中 定义 ， 它 们 复制 、 搜 索 、 打 描 、 比 较 和 传送 字符 串 。streat 足 其 中 的 一 个 典型 函数; 
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char *strcat(char *dst, const char *src) 

该 丽 数 将 src 添 加 到 dst 的 尾 郭 ， 即 ， 它 从 sre 中 复制 包括 空 字符 在 内 的 所 有 字符 ， 并 连续 添加 
到 dst 的 本 尾 . 3EH tte 了 dst 未 尼 的 空 字符 。 

Strcat 也 显 朱 了 企 头 文件 stringh 中 定义 的 函数 的 两 个 缺点 。 第 一 ， 客 户 调用 程序 必须 给 
SRS AC [B], EE Wstreat dst; 第 二 ， 也 是 最 重要 的 缺点 ， 所 有 的 函数 部 不 安全 一 E 
们 都 不 能 检查 结果 字符 串 是 否 足 够 大 。 如 果 dst 不 足够 大 ,不 能 容纳 来 自 src 中 的 多 余 的 字符 ， 
则 streat 将 在 木 分 配 的 存储 区 或 者 其 他 存储 区 写 人 乱码 .一 些 两 数 ， 比 如 strncat， 带 有 一 些 额 
外 的 参数 来 限制 复制 到 结果 中 的 字符 数 ， 这 有 一 定好 处 ， 人 三 是 仍然 会 出 现 分 配 销 误 。 

木 章 撕 述 的 Str 接 口中 的 函数 避免 了 这 些 缺 点 ， 并 为 处 理 字符 中 参数 的 一 字符 员 提 供 了 一 
PATA IE, CREER Ee Pe string. WP AE ARO INA RB Str eR š ER A e ED 
结果 分 配 空间 ， 这 使 得 分 陀 更 加 安全 : 

通常 是 需要 这 些 分 配 的 ， 因 为 string.h 函 数 的 客户 调用 和 猴 序 在 它们 的 大 小 依赖 于 计算 输出 
时 ， 必 须 分 配 结果 就 string.h 了 两 数 而 育 ，Str 函 数 的 容 户 调用 程序 须 释 放 结 果 。 下 -- 
章 将 要 描述 的 Text 接 口 导 出 另外 一 组 处 理 字符 串 的 函数 ， 它 们 能 避免 Str 函 数 的 一 些 分 配 。 


15.1 接口 


(str.h)e 
#ifndef STR INCLUDED 
#define STR.INCLUDED 
#include <stdarg.h> 











(exported functions 244) 


#undef T 
#endif 


Str 接 口中 函数 的 所 有 字符 中 参数 都 出 一 个 字符 数组 指针 (以 空 字符 结束 ) 和 位 置 
(position ) 给 定 。 类 似 于 Ring 的 位 转 ， 字 符 吕 位置 识别 字符 的 只 体位 置 ， 包 括 最 后 个 非 空 
学 符 的 位 曾 。 止 的 位 置 从 字符 串 的 左 端 定位 ， 位 置 1 是 左 端 第 一 个 宁 符 ; 非 让 的 位 置 从 字符 串 
的 右 映 定位， 位置 0 是 右 端 第 一 个 字符 例如， 下 面 的 图 表 担 示 了 宁 符 吕 Interface 中 的 位 答 。 





i 
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字符 串 s 中 的 位 车; 和 j 定 义 了 它们 之 间 的 于 字符 中 ， 出 s [i:j] Won. WR 
"Interface", Wis [-4:0] 就 是 子 字符 市 “face”, 这 些 位 兽 矶 以 以 任何 器 序 给 定 : s [0:4] 也 
RARE? AE "face", EE APA ATL ER, s [3:3] 和 s[ 3:_7] 都 指 的 是 “Interface* th “n” 
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Al “t” HUFF, RP, HIERAR, s niel] 总 是 指 i 右 面 的 那个 字符 ， 
PE CARA. 

TARIE PR ESE BAY hik. OP AST ARE e, LA RR ， 
当 用 学 符 索 引 定义 字符 串 时 ， 顺 序 足 很 重要 的 。 例 如 ， 字 符 串 “Enterface” 中 的 索引 是 从 0 
到 9。 如 果子 字符 串 册 两 个 索引 定义 ， 其 中 该 子 字符 申 从 第 一 个 索引 之 后 开始 到 第 二 个 索引 
之 前 结束 ， 则 $ [1..6] 冠 义 了 子 字符 让 “terf”、 和 但 是 这 种 方法 必须 允许 空 字符 中 索引 ,以便 
His [4.9] 胡椒 子 字符 由 face ， 并 卫 它 不 能 定义 最 前 面 的 空 字符 出 、 改 变 这 种 方法 使 得 所 定义 
的 子 字 符 出 在 第 二 个 索引 后 的 一 个 字符 结 炒 ， 这 样 就 不 会 定义 空 的 字符 串 耻 。 另外 一 种 方法 
ABEL ROLE. 但 是 它 比 使 用 位 贺 的 方法 更 条 烦 - 

使 用 位 次 的 方法 比 使 用 字符 索引 的 方法 好 ， 因 为 它们 避免 了 界限 模糊 的 情况 mH EE 
的 位 置 可 以 用 来 访问 一 个 字符 毕 的 尾部 ， 而 无 需 知 道 它 的 长 度 。 

Sr 得 出 一 些 明 数 ， 这 些 明 数 创建 并 返回 以 空 字符 结束 的 字符 中 ， 同 时 也 返回 字符 中 信息 
TIE. DJ# FA RAUR BE 


(exported functions 244)= 


extern char *Str_sub(const char *s, 
extern char *Str_dup(const char *s, 


extern char *Str cat(const char *s1, 
Const char *s2, int i2, int j2); 


extern char *Str catv — (const char 
extern char *Str reverse(const char 
extern char *Str map (const char 


int i, int j); 

int i, int j, int n); 
int il, int jl, 

xs, 025 


*s, int i, int j); 
*s, int i, int j, 





const char *from, const char *to); 

所 有 这 些 函 数 帮 为 它们 的 结果 分 配 空 间 ， 也 都 能 引发 异常 Mem_Failed， 将 一 个 愉 字 符 
UB FERE E KEE OME MS PUE RE 恰 查 的 运行 期 错误 ， 除 了 下 面 描述 的 
Str_catv 和 Str_map 两 种 情况 ; 

Str_sub 返 同 s 的 子 字符 中 s fj、 例如 下 列 代码 部 返回 "face". 





Str_sub("Interface", 6, 10) 

Str sub("Interface", 6, 0) 

Str_sub("Interface", -4, 10) 

Str sub("Interface", -4, 0) 
这 些 位 置 可 以 按 任 意 顺序 给 定 。 将 ANAT Aj TA HB is HY FP Fi 4638 26328 LL LE 
PRK ABS: PUn de is (THURIS. 

Su. dupi& Pls [ij] 的 n 个 备份 字符 利 ，n 为 负 则 会 产生 可 检查 的 运行 期 错误 。 Str_dup 通 常 
用 来 复制 字符 中 ,例如 ， Str dup ( "Interface", 1, 0, 1 ) 将 返回 字符 串 Interface 的 -- 个 备 
份 。 注 意 使 用 位 置 1 和 0 来 定义 Interface 的 方法 。 

Str_cat 返 回 S1 [i1:j1] 和 s2 [i2:j2] 相连 接 后 的 结果 ， 即 将 字符 中 $2 [i2:j2] 中 的 字符 放 到 
字符 中 s1 [UII 的 字符 后 面 。Str_caty 与 此 类 似 ， 它 所 带 的 参数 每 三 个 -- 组 ,每 组 代表 一 个 
字符 中 和 它 的 两 个 位 置 ,然后 返回 这 些 子 字符 串 连 挡 后 的 结果 。 参数 列表 出 空 指针 作为 结束 








244 














245 








180 RISE 





符 。 例 如 ， 

Str.catv("Interface", -4, 0, " plant", 1, 0, NULL) 
将 返回 字符 串 face plant- 

Str_reverse 将 返回 一 个 包含 s [ij] 中 的 字符 的 字 筹 串 ， 只 不 过 与 在 s 中 显示 的 顺序 相反 。 

Str_map 将 返回 一 个 包含 s [ij] 中 的 字符 的 字符 中 ， 只 不 过 是 按照 由 from 和 to 给 定 的 值 的 
对 应 关系 来 显示 的 。s [ij] 中 显 公 在 from 位 前 的 每 个 字符 部 肌 射 到 to 位 置 的 相应 字符 中 。 设 
有 在 from 显 示 的 字符 则 映射 它们 本 身 ， 例如， 

Str map(s, 1, 0, "ABCDEFGHIJKLMNOPQRSTUVWXYZ" , 

“abcdefghi jk1mnopqrstuvwxyz") 
将 返回 s 的 一 个 备份 ， 只 不 六 大 写 的 字母 被 相应 的 小 写字 母 代替 。 

如 果 from 和 to 都 为 空 ， 将 使 用 最 近 -次 调用 Str_map 所 定义 的 映射 。 如 果 s 为 帘 ， 则 忽略 i 
筑 ， 此 时 from 和 和 to 只 用 于 建立 缺 省 的 映射 ， 间 时 Str_map 将 返回 空 储 ， 

以 下 铺 况 将 会 产生 可 检查 的 运行 期 错误 : from 和 to 中 只 有 -个 指针 为 空 ，fom 和 to 非 空 
fB E UNE AE HS BEAN SE, s. from 和 to 均 为 窄 的 情况 和 在 第 一 次 调用 Str_map 时 from 和 to 
均 为 空 ， 等 等 。 

Str 接 口中 其 他 函数 将 返回 字符 中 信息 或 者 在 字符 器 中 的 位 置 ， 它 们 都 不 分 本 空间 , 

(exported functions 244+= 

extern int Str_pos(const char *s, int i); 
extern int Str len(const char *s, int i, int j); 


extern int Str cmp(const char *sl, int il, int jl, 
const char *s2, int i2, int j2); 


Str posi& lal star Fs [ii] MEWS E, IER LR EC -总 能 转换 成 索引 ， 因 此 ， 在 需 
要 索引 时 ， 常 常 使 用 Str_pos。 例 如 ， 如 果 s 指 向 字符 由 “Interface”， 则 

printf("XsXn", &s[Str pos(s, -4)-1)) 
将 输出 "face", 

Str_len 返 回 s [i:j] 中 的 字 答 数 。 

Str_cmp 返 回 小 于 零 、 等 于 零 各 大 于 零 的 值 、 分 别 对 应 于 s1 [i1:j1] 小 于 、 等 于 和 大 于 
s2 [i2:j2] 的 情况 。 

下 面 的 函数 为 字符 和 兵 他 字符 串 搜索 字符 串 。 如 果 搜 索 成 功 ， 则 这 些 函 数 将 返回 反映 搜 
索 结果 的 止 钓 位 置 ， 如 果 搜 索 失 败 ， 它们 将 返回 零 。 通 数 名 中 带 有 _r 的 湖 数 将 从 它们 的 参数 
字 答 囊 的 最 右 端 开始 搜索 ， 其 他 的 函数 从 左 端 开始 搜索 。 


(exported functions 244) 
extern int Str chr (const char *s, int i, int j, int c); 
extern int Str rchr (const char *s, int i, int j, int c); 
extern int Str upto (const char *s, int i, int ji 
Const char *set); 
extern int Str rupto(const char *s, int i, int j, 
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const char *set); 
extern int Str find (const char *s, int i, int j, 
const char *str); 


extern int Str rfind(const char *s, int i, int j, 
const char *str); 


如 果 c 出 现在 s [ij] 中 ， 则 Str_chr 和 Str_rchr 分 别 返 可 c 从 左 至 右 第 一 次 或 从 右 至 左 第 一 次 
出 现时 在 s 中 的 位 置 的 前 一 个 位 癌 ; 如 果 c 不 出 现在 s [ij] 中 ， 则 返回 零 。 

如 果 set 中 的 任意 字符 c 出 现在 s li) 中 ， 则 Str_upte 和 Str_rupto 分 别 返回 c 从 左 至 右 第 一 次 
或 从 右 至 左 第 一 次 出 现时 在 s 中 的 位 希 的 前 “个 位 置 ; 如 果 c 不 出 现在 s [ij] t, WEAF, 
在 将 一 个 空 set 传 向 这 两 个 函数 时 会 产生 可 检查 的 运行 此 错误 。 

如 果 str 出 现在 8 [uj] 中 ， 则 Str_find 和 Str_rfind 分 曾 返 加 str 从 左 至 右 第 -次 或 从 右 至 左 第 





一 次 出 现时 在 s 中 的 位 壮 的 前 一 个 位 置 ; 如 果 str 不 在 s [i:j] 中 ， 则 返回 零 。 在 将 一 个 空 str 传 向 
这 两 个 函数 时 会 产生 可 检查 的 运行 期 错误 。 
PE RC 


(exported functions 244)+= 

extern int Str any (const char *s, int i, 
const char *set); 

extern int Str many (const char *s, int i, int i. 
const char *set); 

extern int Str rmany (const char *s, int i, int j, 
const char *set); 

extern int Str match (const char *s, int i, int j. 
const char *str); 

extern int Str rmatch(const char *s, int i, int j. 
const char *str); 


HERES, EXER LAT ER BLAS ARR RUE URL 

如 果 字 符 s [iiel] senp, WUStr_anyjg BIZ EA Aes T A) BER TBI AOS RO 20 否则 
返回 零 。 

如 果 s [ijl 是 以 set 中 的 一 个 或 多 个 连续 字符 序列 开始 ， 则 Str_many 返 回 该 字符 序列 的 最 后 
一 个 字符 在 s 中 的 位 置 后 面相 邻 的 位 置 ; 否 旭 ， 返 回 零 。 如 果 s lij] 是 以 set 中 的 一 个 或 多 个 连 
续 字符 序列 结束 ， 则 Str_rmany 返 回 该 字符 序列 第 一 个 字符 在 s 中 的 位 壮 之 前 相 邻 的 位 置 ， 否 
则 ， 返 回 零 。 将 空 的 set 传 递 给 Str_any ，Str_many 和 Str_rmany 都 会 产生 可 检查 的 运行 期 错误 。 

如 果 s [ijj 是 以 str 开 头 的 ， 则 Str_match 返回 str 在 s 中 的 位 置 后 面 的 位 置 ， 再 则 ， 返 回 零 。 
如 果 s [i] 是 以 str 结 束 的 ， 则 Str_rmatch 返 同 str 在 s 中 的 位 置 前 向 的 位 置 ; 否则 ， 返 回 零 。 将 
空 的 str 传 递 给 St_match 或 Str_rmatch 都 将 导致 可 验 查 的 运行 期 错误 . 

Str_rchr 、Str_rupto 和 Str_rfind 从 它们 的 参数 列表 的 最 右 端 开 始 搜索 ， 但 足 返 回 它们 所 搜 
索 到 的 字符 或 者 字符 中 的 左 叮 的 位 置 ， 例 如 ， 下 别 代码 


Str_find ("The rain in Spain", 1, 0, "rain") 
Strirfind("The rain in Spain", 1, 0, "rain") 
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都 返回 5， 内 为 rain 在 它们 的 第 “个 参数 中 只 出 现 一 次 、 Fl (Vi 
Str_find ("The rain in Spain", 1, O, 
Str_rfind("The rain in Spain", 1, 0, "in^ 

Ur NB 78116, Dini r = X. 

Str manyiüStr match|e] APF, FIRE EM Pn) fie TE. Str rmany fü 

Str_rmatch Wid ARE. ETE Flea BL 30 rye. 例如 ， 

Str sub(name, 1, Str rmany(name, 1, 0, " WDD 

返回 name 的 —4- EA, (H E BD fe E JG BLA TWH. MRS BRET TP. mE 

basename iios f 2 87; df ib — Fn Sti BU FA. basename fk Z UNIX US (995 (6 FFE 

回 文件 名 而 不 返回 它 前 面 的 目录 或 者 后 组 ,下面 的 例子 说 明了 这 点 


basename("/usr/jenny/main.c", 1, 0, ".c'") main 

basename("../src/main.c", 1,0, "") main.c 
basename("main.c", 1, 0, "c") main. 
basename("main.c", 1, 0, ".obj") main.c 
basename("examples/wfmain.c", 1, 0, "main.c") wf 


basename f FiStr rchr FR RE gd AR, FiStr rmatch3k ár JF HG 8 


char *basename(char *path, int i, int j, char *suffix) { 
i = Str rchr(path, i, j, '/'); 
j = Str_rmatch(path, í + 1, 0, suffix); 
return Str dup(path, i + 1, j, 1); 

) 


HiStr rchrj& E| PRAY. BRIG MAR ATT, RAT, BANO. AGE 
是 哪 种 情况 ， 文 件 和 名 部 从 位 管 i+1 开 始 - Str_matchi% & X (T4520 B|Us HZ T e AG Pe 2 
后 的 位 置 。 还 有 ， 无 论 足 哪 种 情况 ，j 才 是 文 件 名 之 后 的 位 着 、Str_dup 返 加 il 和 和 j 之 癌 的 path 
中 的 子 字符 中 。 

PARE 


(exported functions 244+= 
extern void Str. fmt(int code, va list *app, 
int putCint c, void *cl), void *cl, 
unsigned char flags[], int width, int precision); 
是 一 个 转换 函数 ， 它 能 和 Fmt 接 口中 的 格式 化 函数 -起 使 用 来 格式 化 子 字符 串 、 它 带 有 个 
参数 : 一 个 字符 中 指针 和 两 个 位 置 ， 并 按照 Fmt 的 %s 定 义 的 风格 来 格式 化 了 字符 中 如 昌 字 
符 中 指针 、app 成 者 flag 为 空 ， 则 会 由 现 可 检查 的 错误 ; 
例如 ， 如 果 山 下 询 函 数 将 St_fmt 和 格式 化 代 玛 S 关 联 在 起， 
Fmt register('S', Str fmt) 


Ju 


Fmt_print("%10S\n", "Interface", -4, 0) 
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HATE “face”, Hp "T ak Ae 
15.2 J: 打印 标识 符 


在 输入 中 打印 关键 字 和 标识 符 的 程序 说 明了 St_fmt 的 用 处 和 为 字符 或 者 其 他 字符 中 检查 
字符 囊 的 两 数 的 用 处 。 


{ids.c= 
#include <stdlib.h> 
#include <stdio.h> 
#include "fmt.h" 
#include "str.h" 


int mainCint argc, char *argv[]) { 
char line[512]; 
static char set[] = "0123456789 " 
"abcdefghi jkImnopqrstuvwxyz" 
"ABCDEFGHIJKLMNOPQRSTUVWXYZ" ; 


Fmt register('S', Str fmt); 
while (fgets(line, sizeof line, stdin) !- NULL) { 
int 1 = 1, j; 
while (Gi = Str upto(line, i, 0, &set[10])) > Of 
j = Str_many(line, i, 0, set); 
Fmt_print("%SNn", line, i, j); 
i=j; 
} 
} 
return EXIT_SUCCESS; 
} 


当 内 部 的 while 循 坏 为 下 -个 标识 符 #f 描 line [i0] 时 ， 从 i=1 开 始 。Str_upto 返 加 line 中 下 
一 个 下 划 线 或 者 line [i0] h Bs: Re GERE, ， 并 且 将 位 置 值 赋 绘 [。Str_many 返 回 数 宁 、 下 划 
线 和 宁 伯 后面 的 位 置 。 这 样 ,i 种 部 标识 下 一 个 识别 符 ，Pmt_print 打 钙 该 识别 等 ， 同 防 也 打 
印 Str_fmt ， 它 与 格式 化 代 侧 S 相 关联 。 反 j 赋 给 、 凡 次 运行 while 循 环 米 坪 找 下 -个 标识 符 。 
当 line 包 含 对 main 的 声明 时 ， 传 递 给 Fmt_print 的 [和 j 的 值 如 下 赂 所 示 。 





j 4 9 13 18 24 30 
int mainQint argc, char tare (1) tí 
i 1 5 0 4 20 26 
在 该 程 谭 中 没有 进行 分 配 。 在 这 些 应 用 中 使 用 位 置 时 ， 常 常 可 以 不 分 配 . 
15.3 实现 


(str.coe 
#include <string.h> 
#include «limits.h» 
#include "assert.h" 
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#include "fmt.h" 
#include "str.h" 
#include "mem.h" 


(macros 251) 
(functions 252) 


SLA AOI y HE IR GZ II k. DOS RE BLUR DAI 2, IER DUE 
ii 右面 的 字符 的 索引 是 i-1， 负 的 位 置 i 右 面 的 字符 的 索引 是 itlen , 其 中 len 是 字符 串 中 的 字符 
总 数 。 宏 
(macros 251)= 
#define idx(i, fen) (Gi) <= 0? (D + Glen) : G) - 1) 
将 这 些 定义 封装 在 一 起 。 假 如 给 定 了 长 度 为 len 的 字符 申 中 的 位 置 1， 则 idx (i, len) 就 是 i 右 
面 的 字符 的 索引 。 
Str 函 数 将 它们 的 位 喃 参数 转换 成 索引 ， 然 后 再 使 用 这 些 索引 访问 字符 串 。 ‘converts 
装 了 转换 的 步骤 ， 
(macros 251)+= 
define convert(s, i, j) do í int len; V 
assert(s); len = strlen(s); \ 
i = idx(i, len); 了 = idx(j, len); N 
if G> Pf int ts tp i257; j= ti FN 
[251] assert(j >= 0 && j <= len); } while (0) 





位 置 ; 利 被 转换 成 0 到 字符 串 s 的 长 度 之 问 的 索引 ， 如 有 必要、 它们 可 以 互相 交换 ， 央 此 i 不 可 
能 超过 。 代 码 块 结束 处 的 断言 利 册 可 检查 的 运 行 期 错误 执行 来 保证 i 和 j 所 标识 的 s 中 的 位 置 
AAR, LAER, HARARE SERE HIR 

Str. sub js T convert fy yk cry FA 





(functions 252)= 
char *Str sub(const char *s, int i, int j) { 
char *str, *p; 


convert(s, i, j); 
p = str = ALOCCj - i + 1); 
while Gi < j) 
*p++ = s[i++]; 
*p = 'NO'; 
return str; 


} 


FE AB ACE RUNE BHI MIR HC BA 面 的 字符 的 索引 , 这 个 字符 有 可 能 是 空 的 结束 符 。 
因此 j-i 就 是 得 到 的 子 字符 串 的 长 度 ， EEE AE. H Bin DEPAR. 

Str_sub#il— 26 H fi AS trie HEHE Ee HEC FF o CHE, ASA E PEBE HR E, 例如 strncpy , 
请 参见 练习 15.2 。 
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15.3.1 字符 串 操 作 


Str_dup 为 s [j| 的 n 个 备份 和 空 的 缚 束 符 分 杞 空间 ， 然 后 将 s [i:j] And, Bes 





ijs, 


(functions 252)+= 
char *Str_dup(const char *s, int i, int j, int n) { 
int k; 
char *str, *p; 


assert(n >= 0); 
convert(s, i, j); 
p = str = ALLOC(n*(j - i) + D; 
if G - i> 0) 
while (n-- > 0) 
for (k = i; k < j; k++) 
*p++ = s[k]; 
*p = NO 
return str; 


H 
Str reverse 类 似 十 Str_sub， 只 是 它 以 相反 的 顺序 复制 字符 : 


(functions 252)+= 
char *Str_reverse(const char *s, int i, int j) í 
char *str, *p; 


convert(s, i, j); 
p = str = ALLOCG - i + 1); 
while (j > i) 
*p++ = s[~-j]; 
*p = AO 
return str; 


) 
Str cat RAEES catv, (UE che SEE CES ML, 


(functions 2524= 
char *Str cat(const char *st, int il, int jl, 
const char *s2, int i2, int j2) { 
Char *str, *p; 


convert(sl, il, j1); 
convert(s2, i2, j2); 
p = str = ALLOCCj1 - il + j2 - i2 + 1); 
while 《il < j1) 
*p++ = sl[il++]; 
while Gi2 < j2) 
*p++ = s2[i2++]; 
*p = '\0'; 
return str; 
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Str cat — AAA, WA Eh AK HH 2209 23 t T 32: 


(functions 252}= 
char *Str_catv(const char *s, ...) Í 
char *str, *p; 
const char *save = s; 
int i, j, len = 0; 
va_list ap; 


va start(ap, s); 
(len < the length of the result 254) 


va end(ap); 
p = str = ALLOCClen + 1); 
S = save; 


va_start(ap, 5); 
(copy each sti:j] to p, increment p 255) 
va. end(ap) ; 
*p = '\0'; 
return str; 
H 


第 一 次 遍历 计算 结果 的 长 度 ， 即 计算 参数 子 字符 中 的 长 度 的 总 和 ， 当 为 结果 分 配 完 袍 间 
后 ， 第 二 次 遍历 将 每 个 分 组 给 出 的 子 字符 中 涂 加 结果 中 。 第 一 次 遍历 是 通过 将 位 置 转换 为 索 


引 的 方法 计算 色 个 于 字符 中 的 长 度 的 ， 如 此 ， 就 能 得 到 长 度 ; 


(len c the length of the result 254)= 
while (s) í 
i = va_arg(ap, int); 
j = va_arg(ap, int); 
convert(s, i, j); 
len += j - i; 
S = va_arg(ap, const char *); 
了 


第 一 个 遍历 几乎 与 此 - 致 ; 惟一 的 不 同 点 是 len 的 作 务 被 复制 子 字 符 中 的 循环 代 赫 ， 


(copy each s[i:j] to p, increment p 255)= 
while (s) t 
i = va .arg(ap, int); 
j = va.arg(ap, int); 
convert(s, i, j); 
while Gi < j) 
*p++ = s[i++]; 
s = va_arg(ap, const char *); 
H 


Str map 建立 了 一 个 数组 map， 上 其 中 map [c] 是 c 的 映射 如 隔山 fom Alto Z X RBE 38 


过 将 s [ij] 中 的 字符 当 作 map 的 索引 ， 可 以 把 s ñ: | 映射 并 A ISI A CEA d ps 


(map s[i:3] into a new string 255)= 
char *str, *p; 
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convert(s, i, j); 
p = str = ALLOCC] - í + D; 
while Gi < j) . 
*p++ = map[(unsigned char)s[i++]]; 
*p = sNO'; 
强制 类 型 转换 符 〈cast ) HUE M127 WF PER SHER EA a 
map 通 过 初始 化 米 建立 ， 以 使 map [c] 等 于 ec， 即 告 个 字符 都 与 它 本 身 对 应 。 然 后 from 中 


的 字符 再 索引 map 中 的 元 老 ， 其 中 map 中 的 字符 就 足 相 应 的 to 中 的 元 素 的 值 : 





(rebuild map 255)= 
unsigned c; 
for (c = 0; c < sizeof map; c++) 
map[c] = c; 
while (*from && *to) 
map[(unsigned char)*frome«] = *to++: 
assert(*from == 0 && *to == 0); 


士 述 声明 实现 了 对 from 和 to 的 长 度 足 行 机 等 的 运行 期 错误 和 检查。 
“from 和 to 都 韭 空 时 ，Str_map 使 用 这 段 代码 块 ， 当 s 非 空 时 ， 它 使 用 Onap slij] into a 
new string 255) (pit ATS. 


(functions 2524 
char *Str map(const char *s, int i, int j, 
const char *from, const char *to) í 
static char map[256] = { 0 3 


if (from & to) { 
(rebuild map 255) 

} else { 
assert(from == NULL && to == NULL && s); 
assert(map['a']); 


} 

if (s) { 
(map s[i: j] into a new string 255) 
return str; 

} else 


return NULL; 
1 


RH, map DHE 9038882598. BA MOP EL AREI, 因此 对 map [a'] 4k 
零 的 声明 将 检查 第 ;次 调用 Str_map 时 from 和 to 是否 有 空 指针 ， BM h. 

索引 为 i 的 字符 左边 的 正 位 痪 是 i+1 ， Str_pos MXARE KGS El ss b ES 的 位 置 1 相对 应 
的 正 的 位 置 。 它 将 ;转化 成 案 引 、 对 它 进行 验证 并 将 它 转 化 回 止 的 位 铬 ， 然后 返回- 








(functions 252)+= 
int Str_pos(const char *s, int i) f 
int len; 


assert(s); 
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257 








len = strlen(s); 

i = ddxCi, len); 

assert(i >= 0 && í <= Jen); 
return i + 1; 


H 
Str leni i-i Rui E FER S| SF BC In RT RO SE FP En) EPA His [E] 的 长 度 : 


(functions 25242 
int Str len(const char *s, int i, int j) { 
convert(s, i, j); 
return j - i; 


H 
Stomp 3: BR AUSF, IRIS ACK, AA eae eee REX: 


(functions 252)+= 
int Str_cmp(const char *s1, int il, int jl, 
const char *s2, int i2, int j2) í 
(string compare 257) 


) 
Str_emp Kil Fj] £e ps 1 PAY ASL, HAZA S2 PAY RS : 


(string compare 257)= 
convert(sl, il, j1); 
convert(s2, i2, j2); 


然后 ， 再 调整 sl Als2 以 分 别 指向 它们 的 第 一 个 字符 、 


(string compare 257)H= 
sl += il; 
s2 += i2; 
5S1[131] 和 s2[i232] 中 较 短 的 那个 字符 趾 决 年 了 要 比较 的 字符 的 数 日 ， 这 是 通过 调用 strmcermp 
KERR 
{string compare 257)+= 
if (jl - il < j2 - i2) { 
int cond = strncmp(sl, s2, jl - il); 
return cond == 0 ? -1 : cond; 
} else if (j1 - il > j2- i2) { 
int cond = strncmp(sl, s2, j2 - i2); 
return cond == 0 ? +1 : cond; 
} else 
return stracmp(s1, 52, jl - il); 
dn Jis 1[i1:j i] 比 s2[i2:j2] 短 JF E memempi& MA WS, WistG1:j1]Æs262:j21 AR, H 
此 s1[i1:j]] 比 s2[i2:j2] 小 ,第 个 if 语 名 处 理 相 反 的 情况 ，else 语 句 则 在 s1 和 s2 的 参数 的 长 度 
相等 的 时 候 使 用 。 
标准 规定 strncemp( 和 memcmp ) 必须 将 sI 和 s2 中 的 字符 当 作 无 符号 型 字符 ,这样 有 助 十 
在 s1 或 s21' 的 字符 值 大 于 127 时 得 到 定义 良好 的 结果 ,例如 ,strnemp ( 344^, 61277, 1) 
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必须 返回 一 个 止 值 。 但 是 strncmp 的 一 些 实现 没有 正确 地 比较 “无 将 式 ” 字符， 其 中 这 些 字 
符 可 能 是 无 符号 的 ， 也 可 能 足 有 符号 的 。 对 于 这 些 实现 ，strnemp (73447, 127", 1) 可 
以 返回 一 个 负 值 。memcmp 的 一 些 实现 也 可 能 产生 同样 的 错误 。 





15.3.2 分 析 字 符 串 


其 余 的 函数 从 左 向 右 或 者 从 右 向 左 检查 字符 中 ， 搜 索 是 否 有 字符 或 者 其 他 字符 串 出 现 。 
如 果 搜 索 成 功 ， 则 它们 都 返回 一 个 庄 的 位 局 值 ， 否 则 返回 零 。Str_chr 是 其 中 的 典型 : 


(functions 252549 
int Str chr(const char *s, int i, int j, int c) f 
convert(s, i, j); 
for C; i < ji i++) 
if G[i] == c) 
return i + 1; 
return 0; 


H 
Str rchr 3/6204. FUE TE As irj] 的 最 右 端 开始 搜索 : 


(functions 252}+= 
int Str rchr(const char *s, int i, int j, int c) í 
convert(s, i, j); 
while (j > i) 
if (s[--j] == c) 
return j + 1; 
return 0; 


H 
如 果 c 出 现在 s Gi] 中， 则 这 两 个 函数 都 返回 与 左 相 邻 的 正 的 位 置 、 
Str_apto 和 Str_rupto 同 Str_chr 和 Str_rchr 类 似 ， 只 是 它们 寻找 一 个 集合 中 的 任意 字符 是 否 
在 s [i] 中 出 现 ， 


(functions 252)+= 
int Str_upto(const char *s, int i, int j, 
const char *set) { 
assert(set); 
convert(s, i, j); 
for (C id « ji ie 
if (strchr(set, s[i])) 
return i + 1; 
return 0; 


int Str rupto(const char *s, int i, int j, 
const char *set) { 
assert(set); 
convert(s, i, j); 
while (j > i) 
if Cstrchr(set, s[--j])) 
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return j + 1; 
return 0; 


+ 
Str find RE EH Ms [ij] PHP, EEMS findBf .将 长 度 为 0 或 1 的 字符 中 当 
作 特 吻 情况 米 处 理 。 


(functions 252)}+= 
int Str find(const char *s, int i, int j, 
const char *str) { 
int len; 


convert(s, i, j); 

assert(str); 

len = strlen(str); 

if (len == 0) 
return i + 1; 

else if (len -- 





) í 
for C; i < j; i+) 
if (s[i] == *str) 
return i + 1; 
} else 
for ( ; i + len < j; i++) 
if Gs[i..] = str[0..len-1] 260)) 
return i + 1; 
return 0; 


} 


如 果 str 没 有 字符 ， 搜 索 总 能 成 功 。 如 果 str 只 有 一 个 字符 ，Str_Find 等 价 十 Str_chr， 通 党 
情况 下 ，Str_find 在 s [ij] 中 搜索 str， 但 是 要 注意 不 能 接 党 超过 该 子 字 符 串 未 尾 伺 符 全 条件 的 
搜索 结果 : 


(s{i...] = str[0..Ten-1] 260)= 
(strncmp(&s[i], str, len) == 0) 


Str rfindti 8 ARIA = AOE. IB E E F] PUR REAR, 


(functions 252)4= 
int Str.rfind(const char *s, int i, int j, 
const char *str) í 
int len; 


convert(s, i, j); 
assert(str); 
len = strlen(str); 
if (len == 0) 

return j + 1; 
else if (len = 1) { 

while (j > i) 

if (s[--j] == *str) 

return j + 
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} else 
for ( ; j - len >= i; j--) 
if (strncmp(&s[j-len], str, len) == 0) 
return j - len + 1; 
return 0; 
} 
调用 Str_rfind 时 也 必须 小 心 ， 它 不 能 接受 越过 该 子 字符 串 的 并 头 但 符合 条 件 的 结果 。 
Str_any 和 与 它 一 组 的 责 数 帮 不 提 索 字符 或 者 字符 中 .而 具足 打 搞 这 些 或 宁 符 串 并 检 
查 它 们 是否 出 现在 所 讨论 的 子 字 符 吊 的 开始 或 末尾 。 如 果 s[i:i+1] 尽 集合 set 中 的 宁 符 ， 则 
Str_any 返回 Str_pos{s,i)+1: 





(functions 252)+= 
int Str any(const char *s, int i, const char *set) { 
int len; 


assert(s); 

assert(set); 

len - strlen(s); 

i = idxCi, lem; 

assert(i >= 0 && i <= len); 

if Gi < len && strchr(set, s[i])) 
return i + 2; 

return 0; 


} 


如 果 测 试 成 功 ， 则 i+1 加 -转化 成 正 的 位 置 ， 这 就 是 为 什么 Str_any 返 回 计 2 的 原因 , 
Str-many 将 扫描 集合 set 中 的 “个 或 多 个 出 现在 s |i:j] HARFI.: 


(functions 252)+= 
int Str_many(const char *s, int i, int j, 
const char *set) { 
assert(set); 
convert(s, i, j); 
if Gi < j && strchr(set, s[i])) í 
do 
iei 
while Ci < j && strchr(set, s[i])); 
return i + 1; 
H 
return 0; 


) 
Str rmany EJ A E Att Mi $E set TAY 一 个 或 多 个 出 现在 s[ij] 林 尾 的 字符 


(functions 2524= 
int Strirmany(const char *s, int i, int j. 
const char *set) í 
assert(set); 
convert(s, i, j); 
if G > i && strchr(set, s[j-1))) £ 
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192 - 
do 
--j; . 

while Cj >= i && strchr(set, s[j])); 
return j + 2; 

} 

return 0; 

} 


当 do-while 循 环 结束 时 ，j 等 十 i-1 或 是 不 在 集合 set 中 的 字符 的 索引 。 对 丁 第 -种 情况 ， 
Set rmany 必须 返回 +1; 而 第 二 种 情况 ， 必须 返回 字符 s [ji 右面 的 位 置 。 人 在 这 两 种 情况 下 ， 
j+2 帮 是 正确 的 。 

如 果 str 出 现在 s [ij] 的 开头 ， 则 Str_match 返 回 Str_pos(s,D+strlen (str )。 同 Str_find 类 似 ， 
长 度 为 0 或 1 的 字符 串 要 当 作 特殊 情况 处 理 : 


(functions 252)+= 
int Str match(const char *s, int i, int j, 
const char *str) { 
int len; 


convert(s, i, j); 

assert(str); 

len = strlen(str); 

if (Ten = 0) 
return i + 1; 

else if (len == 1) { 
if G < j && s[i] == *str) 

return í + 2; 

} else if (i + Ten <= j && (s[i...] =str[0..len-1] 260)) 

return i + len + 1; 
return 0; 


} 

RRF, TEE is lij) 末尾 的 匹配 字符 串 。 

Str_rmatch 中 情况 与 此 类 似 ， 这 里 必须 避免 超过 s [j| 开头 的 匹配 字符 串 ， 而 且 长 度 为 0 
或 1 的 字符 申 要 当 作 特殊 情况 处 理 。 


(functions 252)+5 
int Str.rmatch(const char *s, int i, int j, 
const char *str) { 
int len; 


convert(s, i, j); 
assert(str); 
Ten = strlen(str); 
if (len == 0) 
return j « 1; 
else if (len == 1) í 
if (j > i && s[j-1] == *str) 
return j; 
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} else if (j - len >= i 

&& strncmp(&s[j-len], str, len) == 0) 
return j - len + 1; 

return 0; 


15.3.3 RRA 


最 请 一 个 函数 是 Str_fmt ， 这 是 一 个 定义 在 Fmt 接 口中 的 转换 函数 。 转 换 函 获 的 调用 序列 
在 第 14.1.2 节 有 所 描述 。flags width 利 precision 参 数 将 确定 字符 中 足 怎 样 被 格 忒 化 的 。 
Str_fmt 最 重要 的 特征 就 是 它 带 有 三 个 参数 ， 这 三 个 参数 痢 来 口 参 数列 表 的 变量 部 分 ， 其 
中 参数 列表 将 被 传递 给 其 中 一 个 Fmt 函 数 。 这 - :个 参数 定义 了 一 个 字符 出 和 字符 中 中 的 两 个 
位 置 。 这 些 位 置 给 出 了 子 字符 由 的 长 度 ， 并 生 同 flags 、width 利 precision 一 起 决定 该 子 字 符 
曲 是 怎样 被 发 送 的 。Str_fmt 使 用 Fmt_puts 米 说 明 这 些 值 计 发 送 宁 符 中; 
(functions 2525 
void Str fmt(int code, va list *app, 
int putCint c, void *cD, void *cl, 
unsigned char flags[], int width, int precision) { 
char *s; 
int i, j; 





assert(app && flags); 

S = va arg(*app, char *); 

i = va arg(*app, int); 

j = va.arg(*app, int); 

convert(s, i, j); 

Fmt puts(s + i, j - i, put, cl, flags, 
width, precision); 

} 


参考 书目 浅 析 


Plauger (1992 ) 曾经 对 在 string.h 中 定义 的 浙 数 给 于 了 简短 的 批评 ， 并 说 明了 如 何 去 实 
BUE], Roberts (1995 ) 描述 了 一 个 简单 的 字符 毕 接口 ， 该 接口 与 Str 类 似 并 且 也 是 基于 
string.b 的 。 

Str 接 口 的 设计 逐 字 逐 句 地 通过 Icon 程序 语言 (Griswold and Griswold 1990 ) 的 字符 带 
处 理工 具 得 到 改进 。 使 用 位 置 而 非 案 引 并 且 使 用 非 拒 的 位 置 来 定义 相对 十 Icon 产生 的 字符 趾 
HR FER AL 

Str B) eR Icon ri RO Fa] Az ATT, Icon 函数 处 再 能 力 喝 强 ， 因 为 它们 使 用 Icon 的 直 
达 目 标的 评价 机 制 。 例 如 ，Icon 的 find 函数 可 以 返回 一 个 字符 中 在 另 一 个 字符 中 中 所 有 出 现 
的 位 置 。Icon 也 有 字符 崇 扫 描 功 能 ， 再 加 上 直达 目标 的 评价 机 制 . 便 有 了 强大 的 模式 匹配 
能 力 。 
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Str_map 也 可 用 于 实现 多 种 类 型 的 字符 中 转化 ， 例 如 ，* 是 -个 含有 7 个 字符 的 字符 中 ， 
Str.map("abcdefg", 1, 0, "gfedcba", s) 


练习 


15.1 


将 返回 s 的 倒序 。Griswold ( 1980 ) 探讨 了 这 种 映射 的 使 用 


扩展 ids.c， 使 得 它 能 识别 并 忽略 C 语 i 的 注释 、 字 答 串 交 字 和 关键 字 。 泛 化 你 六 
展 的 版 本 ， 使 它 能 接受 命令 行 参 数 来 定义 共 他 将 要 第 忽略 的 说 别 符 

Str 的 实现 能 使 用 标准 C 库 里 的 字符 串 和 内 在 鹃 数 ， 比 如 使 用 Strmnepy 和 memcpy , 
来 复制 字符 出。 例如 ，Str_subaj 以 写成 如 下 形式 ， 


char *Str_sub(const char *s, int i, int j) { 
char *str; 








= 


convert(s, i, j); 

str = strncpy(ALLOCGj - i + 1), s + i, j - í); 
strij - i] = 'N0'; 

return str; 


} 

一 些 C 编 详 器 能 够 识别 对 string.h 中 的 浙 数 的 调用 ， 并 二 产 牛 内 部 代码 ， 上 其 中 内 部 
ARGH CTA FE REE , eoe pb AE UC Aia ALB CREUSE Huic, fe TRE 
Bg Jr (String bP ig eddie DOE HIS. E ROLE TTE CAR 
PERE HES, US RR i ETAT HB S SUNK IED TREE 
设计 并 实现 一 个 函数 ， 使 它 能 搜索 -个 几 正 则 表达 式 (regular expression ) ( 比如 
那些 AWK 支 持 的 和 在 Aho Kernighan 和 Weinberger ( 1988 ) |] Hf XE Bo RIKE ) 定 
义 的 子 字符 市。 该 画 数 需 要 返回 两 个 值 : 开始 正 配 的 位 置 相 子 字符 中 的 长 度 。 
Icon d —T TATE ELSE. "E09"? ”操作 答 建 六 了 一 个 支持 字符 中 和 该 
学 符 串 中 的 位 置 的 打 描 环境 。 字 符 串 兵 数 ， 比 如 find ,可 以 只 出 -个 参数 来 激活 
SOT ROBE TR fe TE A. lon 的 字符 中 站 描 工 具 (在 Griswold 和 
Griswold (1990) 中 讲述 )， 并 设计 和 实现 一 个 提供 类 似 功 能 的 接口 。 
String.h;g X f j& 

char *strtok(char *s, const char *set); 

将 8 分 成 出 集合 set 中 的 字符 分 离 的 记号 。 通 过 反复 调用 strtok , 将 字符 种 s 分 成 多 个 
记号 。s 只 有 在 第 -次 湖 几 strtok 时 省 被 传递 ， 并 导 strtok 搜 索 第 一 个 不 在 集 谷 set 
的 字符 并 用 -个 空 字符 笨 兼 ， 半 返回 s ， 尘 后 的 调用 (它们 都 具有 strtok (NULL, 
set) 的 形式 )， 将 使 strtok 在 它 离间 的 位 普 继 续 捍 索 第 一 个 在 set 中 的 字符 ， 并 用 一 
个 空 字符 材 盖 ， 然 后 返回 指向 所 代表 字符 中 头 部 的 指针 ， 在 不 同 的 调用 巾 se 
以 不 同 。 如 果 搜 索 失 败 ，strtok 返 回 帘 值 ， 几 提供 类 侯 能 力 的 两 数 来 扩 展 Str 接 11. 
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15.6 


但 是 不 要 修改 它 的 参数 。 你 可 以 改进 strtok 的 设计 由? 
St 函数 总 是 为 它们 的 结果 分 配 空间 ,其 中 这 些 空间 在 某 些 应 用 中 可 能 不 尽 必须 的 > 
假定 接受 了 个 可 选 的 日 标 ， 并 且 只 有 在 目标 是 空 指针 时 ， 才 分 配 空 间 。 例 如 ， 


char *Str dup(char *dst, int size, 

const char *s, int i, int j, int n); 
在 dst 非 空 时 将 结果 存储 在 dst[0,.size-]1] 并 返回 dst。 和 否则 ， 它 将 为 结果 分 配 空 间 ， 
就 像 当 前 版 本 做 的 那样 。 设 计 一 个 基于 这 种 方法 的 接口 。 赔 清楚 size 太 小 时 会 发 
生 什 么 事情 。 将 你 的 设计 和 和 Str 接口 比较 ， 哪 -个 更 简单 ” 娜 - -个 更 不 容易 出 错 ? 
下 面 是 舅 外 一 个 避免 在 Str 函 数 中 分 配 空间 的 建议 。 假 定 函数 
void Str result(char *dst, int size); 
将 dst 所 谓 的 结果 字符 串 传递 给 下 一 次 Str 函 数 调 用 。 如 果 结 果 字 符 中 非 空 Str 
数 将 它们 的 结果 存储 在 dst [0..size-1] 中 并 清除 结果 字符 申 指针 。 如 果 结 果 字 符 申 
253, ， 则 它们 与 通常 一 样 ， 为 结果 分 配 空间 。 对 此 建议 从 优 劣 两 方面 进行 讨论 。 
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第 16 章 ”高 级 字符 串 


上 一 章 济 述 的 Str 接 口 导 出 的 隆 数 增加 了 C 中 处 理 字 符 惠 的 能 力 。 按 照 惯例 ， 字 符 串 就 是 
字符 数组 ， 其 中 数组 的 最 后 一 个 字符 为 室 、 员 然 这 种 表示 方法 存 很 多 应 用 中 已 经 足够 了 .但 
是 它 有 两 个 严重 的 缺点 . 第 一 , SRT EK 度 需 汰 搜索 该 字符 申 的 结束 标志 空 宁 符 ， 
因此 计算 字符 串 的 长 度 所 用 的 时 间 与 字符 串 的 长 嵌 成 比例 、 第 一 ，Str 搂 日 中 的 两 数 和 标准 
库 中 的 一 些 两 数 都 假定 字符 中 可 以 改变 ， 因 此 盛 论 是 它们 还 是 它们 的 调用 者 都 必须 为 字符 串 
分 配 空间 ， 而 在 孝 些 不 修改 字符 申 的 应 用 中 ， 不 必 为 字符 中 分 本 空间 。 

本 章 要 讲述 的 Text 接 口 所 使 用 的 表示 方法 硝 有 不 同 ， 从 市 克服 上 述 两 个 缺点 。 计 算 长 
度 的 时 问 是 固定 的 ， 因 为 它们 同 字 符 趾 联系 在 :起 .而 且 只 有 在 必要 的 时 候 才 会 分 配 空间 。 
由 Text 提 供 的 字符 中 是 岗 定 的 一 一 即 它们 不 能 被 随意 改 杰 一 并且 它 包 含 一 个 内 部 的 宰 字 
符 。Text 为 它 的 字符 串 表 孙 方法 和 C 形 式 的 字符 毕 之 问 的 转换 棍 供 了 - 些 函 数 ， 而 这 些 转换 
就 是 Text 性 能 改善 所 付出 的 代价 。 





16.1 #0 


Text 接 口 用 -个 两 元 素 的 描述 符 来 表 术 字符 中 ， 上 其 中 该 描述 符 给 出 了 字符 中 的 长 度 并 指 
向 它 的 第 一 个 字符 : 


(exported types 270)= 
typedef struct T í 
int len; 
const char *str; 
) T; 


(text. A= 
#ifndef TEXT_INCLUDED 
#define TEXT. INCLUDED 
#include «stdarg.h» 


#define T Text T 


(exported types 270) 
{exported data 274) 
(exported functions 271) 


$undef T 

#endif 
由 str 域 指向 的 字符 中 并 不 用 空 字符 作 结束 符 。 由 Text_T s 指 向 的 字符 串 可 以 包含 任 意 字符 ， 
包括 空 字符 。Text 显 未 了 描述 符 的 表示 方法 ， 以 便 客户 调用 程序 可 以 直接 访 问 城 。 如 果 给 定 
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-个 TextLTs， 则 s.ien 给 出 了 字符 市 的 长 度 ， 并 通过 s,str [0,,s.len-1| 来 访问 具体 的 字符 。 

客户 调用 程序 可 以 读 取 Text_T 的 域 以 帮 它 所 指向 的 字 答 中 中 的 字符 ， 和 但 是 它们 不 能 改变 
域 友 宁 符 ， 除 非 通过 该 接 日 中 的 函数 ,或 痢 通过 它们 初始 化 的 Text_T 中 的 函数 ,或 者 由 
Text_box 返 回 的 函数 才能 改变 。 改 变 一 个 由 Text_T 光 述 的 字符 帅 将 会 产生 可 检查 的 运行 期 错 
误 。 将 一 个 带 有 负 的 ]en 域 或 空 的 str 域 的 Text_T 传 递 给 该 接口 中 的 任何 函数 ， 也 会 产生 可 检 
查 的 运行 期 错误 。 

Text 导 出 各 种 函数 ， 这 些 函 数 通过 值 来 传递 并 返回 描述 符 ， 即 ， 函 数 传递 得 返回 的 是 描 
述 符 本 身 而 非 将 指针 传递 给 描述 符 。 其 后 果 症 所 有 的 Text 丽 数 都 不 分 配 描述 符 - 

在 必要 的 时 候 ， 一 些 Text 函 数 的 确 为 字符 串 木 身分 配 空间 该 字符 串 空 间 完 全 由 Text 来 
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处 理 ; 涂 了 下 面 描述 的 情况 外 ， 客 户 调用 程序 不 能 合 放 字符 申 。 用 外 部 工具 释放 字符 串 ， 比 
如 调用 free 或 者 Mem_free， 会 产生 不 可 检查 的 运行 期 错误 。 
函数 
(exported functions 271)= 
extern T Text put(const char *str); 


extern char *Text get(char *str, int size, T s); 
extern T Text box(const char *str, int len); 


将 在 描述 符 和 C 形 式 的 字符 串 之 问 转 换 。Text_put 将 以 空 字符 结束 的 字符 中 str 复 制 到 字符 趾 
空间 并 为 新 的 字符 串 返回 一 个 描述 符 。Text_put 可 以 引发 异常 Mem_Failed。 如 果 str 为 空 ， 则 
会 产生 可 检查 的 运行 期 错误 。 

Text-get 将 s 所 描述 的 字符 串 复制 到 str 0..size 2) rh. Hem .个 空 字符 并 返回 sr 。 如 果 
size 小 于 s.len+1 ， 则 会 产生 可 检查 的 运行 期 错 识 。 如 果 str 为 个 ， 则 Text_get 将 忽略 size 、 油 用 
Mem_alloc 来 分 配 slen+1 个 字 节 前 空间 ， 然 后 将 s.str 复 制 到 里 面 并 返回 该 分 陀 空 间 的 开头 指 
针 。 如 果 str 为 空 ，Text_get 可 以 引发 异常 Mem_Failed . 

客户 讽 用 程序 调用 Text_box 来 为 常 好 字符 趾 或 者 它们 白 己 分 配 移 字符 赴 建立 撒 述 符 。 它 
用 一 个 描述 符 将 str 和 en“ 装 箱 ” 并 返回 该 描述 符 。 例如， 









static char editmsg[] = “Last edited by: "; 

Text.T msg = Text box(editmsg, sizeof Ceditmsg) - 1); 
将 "Last edited by :” 赋 给 msg。 注 意 Text_box 的 第 个 参数 忽略 Teditmsg 林 尾 的 空 ë 
WOR OS TF ULE TUE ARTA Emsg W RNY Seria — AY str 75 ae Alen 为 
负 部 将 会 产生 可 检查 的 运行 期 错误 ， 

许多 Text 函 数 都 接受 字符 中 位 首 ， 这 里 的 位 普 同 在 Str 中 定义 的 位 置 类 似 - 位 着 识别 字符 
间 的 基体 定位 ， 包 括 第 一 个 字符 之 前 的 位 兽 和 最 后 个 字符 之 后 的 位 置 。 止 的 位 置 从 字符 中 
的 最 左 端 第 一 个 字符 开始 ， 而 非 止 的 位 置 从 字符 电 的 最 厂 端 第 一 -个 字符 开始 例如 ， 下 图 摘 
ARISE, PRAT ASA “Interface” Hay ym 
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LT 
PAPALIT IG 


函数 
(exported functions 271)+= 
extern T Text_sub(T s, int i, int j); 


AE FRUTAS Sisi (E Ti A ZI AT FRR RER, RE CL AUT A AEE. 例如 ， 如 果 
Text T s = Text put("Interface"); 

则 下 列表 达 式 
Text_sub(s, 6, 10) 
Text_sub(s, 0, -4) 


Text_sub(s, 10, -4) 
Text sub(s, 6, 0) 


者 返回 子 字符 中 “face” 的 措 述 符 ， 

器 然 客 户 调用 程序 不 改变 字符 出 中 的 字符 ， 亨 且 字符 申 也 不 需要 空 字符 作为 结束 符 ， 所 
以 Text_sub 值 返回 一个 TextT， 其 中 sfr 域 指向 s 的 车 字符 趾 的 第 一 个 字符 ，len 域 是 子 字符 中 
的 长 度 。s 和 返回 值 可 以 共享 一 个 具体 的 字符 中 中 的 字符 ， 并 月 Text_sub 不 分 配 空间 。 然 而 ， 
客户 滑 用 程序 不 能 依靠 和 共享 同一 个 字符 串 的 返回 值 ， 内 为 Text 可 能 将 空 的 字符 串 和 只 显 
不 字符 的 字符 串 当 作 特殊 情况 来 处 理 。 人 部 分 由 Text 导 出 的 函数 都 同 Str 革 出 的 通 数 类 似 ， 但 
是 它们 当中 有 很 多 不 接受 位 名 参数 ， 内 为 Text_sub 能 以 最 小 的 代价 拱 供 相同 的 功能 。 

ri 


(exported functions 271)+= 
extern int Text pos(T s, int i); 


返 下 任意 位 兰 i 在 s 中 相应 的 止 的 位 置 。 例 如 ， 如 果 s 等 于 “interface”， 则 

Text_pos(s, -4) 
将 返回 6 ， 

如 果 Text_pos 中 的 ;或 者 Text_sub 中 的 i 或 j 定 义 了 一 个 在 s 中 不 存在 的 位 置 , 则 会 产生 可 检 
查 的 运行 期 错误 ， 

AR 

(exported functions 271)+= 

extern T Text. cat (T si, T $2); 


extern T Text. dup (T s, int n); 
extern T Text. reverse(T s); 
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sl 和 s2 连 接 后 的 字符 中 的 描述 符 ， 如 果 s1 成 者 s2 为 空 字符 串 ， 将 返回 上 共 他 参数 。 而 且 ， 
Text_cat 只 有 在 必要 时 才 复 制 S1] 和 82 ， 

Text_dup 将 返回 D 个 8 相连 楼 后 的 字符 中 的 措 述 符 ;如 果 n 为 负 ， 则 会 产生 可 检查 的 运行 期 
错误 。Text_reverse 将 以 相反 的 顺序 返回 字符 申 s . 


(exported functions 271)H= 
extern T Text map(T s, const T *from, const T *to); 


将 如 下 根据 from 和 to 指向 的 字符 下 来 返回 s 的 映射 结果 。 对 s 中 每 个 出 现在 from 中 的 字符 ，to 
中 相应 的 字符 就 出 现在 结果 字符 中 中 :如 各 中 的 字符 没有 出 现在 from 中 ， 则 字符 本 身 在 条 
出 中 不 改变 显示 。 例 如 ， 
Text map(s, &Text ucase, &Text !case) 
Té Els 00 — S fr. FUE IR Jos rh 0 K FE Oi RARE Y. Text ucasedü 
Text_lcase 是 内 Text 输 出 的 页 先 定义 的 描述 符 的 例子 。 完整 的 列表 是 : 
(exported data 274)= 
extern const T Text_cset; 
extern const T Text_ascii; 
extern const T Text_ucase; 
extern const T Text lcase; 


extern const T Text digits; 
extern const T Text null; 


Texi cset &— 4 8 44 BU 256 8 MEM EAH, Text-ascii t 6 127 ASCII FF, 
Text_ucase 2% ffi "ABCDEFGHIKLMNOPQRSTUVWXYZ", Text lcase “E 4f 8 
"abcdefghijkImnopqrstuvwxyz", Text digits 20123456789, ii/Text nullJl] & 28 22 ff, 
客户 调用 程序 可 以 用 这 些 字符 目的 子 字符 品 来 组 城 新 的 宁 符 囊 。 

Text, maps i fi Yt 3E 2s fffrom 和 te 值 ， 并 几 当 from 和 to 均 为 为 实时 将 使 用 这 些 值 。 
人 om 和 te 由 只 有 一 个 为 空 ， 或 者 当 from 和 to 非 空 时 freom->len 不 等 本 to->lea ， 则 会 产生 可 检查 
的 运行 期 错误 .Text_map 可 以 引发 异常 Mem. Failed | 

字符 中 通过 调用 如 下 eel IT HE e. 


(exported functions 271)+= 
extern int Text_cmp(T sl, T 52); 


函数 返回 小 于 零 、 等 于 零 和 大 于 零 的 值 ， 分 别 对 应 按 词典 序 s1 的 字符 少 丁 s2、 等 于 s2 和 大 于 
$2 三 种 情况 、 

Text 导 出 一 组 字符 市 分 析 晒 数 ， 这 些 函 数 与 Str 导 出 的 硅 些 函数 几乎 一 臻 下面 将 要 描述 
的 范 数 的 确 接受 所 检查 的 字符 中 中 的 位 嗓 ， 这 些 位 置 通常 产生 表示 分 析 的 状态 的 编码 。 在 下 
面 的 描述 中 ，s lij] Rass te Ae Mi AZA ERER, Wis Ú] ER (EFL WH A 

下 商 的 函数 将 搜索 单个 字符 或 者 一 组 字符 - 在 任何 情况 下 ， 如 蚜 或 痢 表 示 一 个 不 存在 
的 位 置 ， 则 会 产生 可 检查 的 运行 期 错误 。 
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‘(exported functions 27145 
extern int Text chr (T s, int i, int j, int c); 
extern int Text rchr (T s, int i, int j, int c); 
extern int Text upto (T s, int i, int j, T set); 
extern int Text rupto(T s, int i, int j, T set); 
extern int Text any (T s, int i, T set); 
extern int Text many (T s, int i, int j, T set); 
extern int Text rmany(T s, int i, int j, T set); 
Text_chr 返 回 c 在 s [ij] Ug 22th S ze HE (PR, Text rehrj&Bal Is HR REEE, X 
两 个 函数 当 c 不 出 现在 s [ij] 中 时 都 返回 零 值 。Text upto 返 回 s [ij] 中 最 大 出 现 set 中 任意 元 素 
的 左 邻 止 位 置 ，Text_rupto 返 回 最 右 出 现 左 邻 下 位置。 如 果 set 中 苑 素 不 出 现在 s lii dh. MUJ 
这 两 个 函数 都 返回 零 值 ， 
MRs |i] 等 于 c MText_any Ww Text_pos(si+l. GW. ENP. WMHs | [ij] 由 集合 set 
中 的 一 个 字符 开始 ， 则 Text_many 返 回 - -个 正 的 位 普 ， 后 向 屁 set 中 的 非 空 字符 的 序列 ， 否 则 ， 
BEA. WAS [uj] 出 set 中 的 一 个 字 答 结束 ， 则 Text_rmany 返 苛 set 中 的 字符 组 成 的 非 空 序 
MRM Ma. esp. RE, 
些 寻 找 字 符 串 的 分 析 函 数 。 
(exported functions 271)+= 
extern int Text find (T s, int i, int j, T str); 
extern int Text rfind (T s, int i, int j, T str); 


extern int Text match (T s, int i, int j, T stc); 
extern int Text rmatch(T s, int i, int j. T str); 


Text. findj& Flstr fes [ij] 中 出 现 的 最 左 端的 位 置 之 前 的 “. 个 正 位 置 ， 而 Text_rfind 返 四 str 在 
s ij) 中 出 现 的 最 右 端 的 位 加 之 前 的 “个 下 的 位 短 。 如 果 str 生 8 lij] PAR Hi mm, SUK RI enc 
都 返回 零 值 。 
如 果 s [ij] 从 字符 趾 str 开 始 ， 则 Text_match 返 加 Text_， pos(s,i)+str.Jen， 否 则 返回 零 值 、 
Ed 
(exported functions 27\)+= 
extern void Text fmt(int code, va list *app, 


int putCint c, void *cl), void *c1, 
unsigned char flags[], int width, int precision); 





可 以 在 Fmt 接 口中 作为 转换 函数 来 使 用 。 它 使 用 Text_T 的 指针 并 根据 可 选 的 参数 flags 、width 
和 precision 来 格 虑 化 字符 叫 ， 上 其 中 格式 化 方式 同 printf 代 三 %s 格 式 化 蕊 参数 的 方式 相同 
使 用 Text_T 的 指针 是 因 W isu EH, EM RARE SS FR WJ k EER e AS 
TERE, MAT ext_Tiy ESI Ws, ok Rappubflags H5, 都会 产 牛 可 检查 的 运行 期 

Tex( 给 了 客户 调用 穆 序 有 限 的 控制 权 来 控制 字条 中 空间 的 分 名 ， 其 中 字符 申 空 间 朋 来 在 
铺 上 而 所 描述 的 能 返回 描述 符 的 旺 数 所 返 辐 的 结果 字 管 中。 BEAR. FE eR BH (HE n] 
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(exported types 270345 
typedef struct Text save T *Text_save_T; 


(exported functions 2714 
extern Text save T Text save(void); 
extern void Text restore(Text save T *save); 





16.2 实现 


Text 的 实现 同 Str 的 实现 非常 相似， 但 是 Text 丽 数 可 以 对 - 
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下 面 将 详细 介绍 。 


(text.c)= 
#include <string.h> 
#include <Timits.h> 
#include "assert.h" 
#include "fmt.h" 
#include “text.h" 
#include "mem.h" 


#define T Text_T 


(macros 278) 

(types 287) 

(data 277y 

(static functions 286) 
(functions 278) 


FE AE FES FEBS T — SH BE 256-4 APL AR T PPP 


(data 277)= 
static char cset[] = 
"\000\001\002\003\004\005\006\007\010\011\012\013\014\015\016\017" 
“'\020\021\022\023\,024\025\026\027\030\031\032\033\034\035\036\037" 
"\040\041\042\043\044\.045\046\047\050\051\052\053\054\055\056\057" 
"\060\061\062\063\064\ 065\066\067\070\071\072\073\074\075\076\077" 
"\100\101\102\103\104\105\106\107\110\111\112\113\114\115\116\117”" 
“\120\121\122\123\124\125\126\127\130\131\132\133\134\135\136\137" 
"N140\141\142\143\144\145\146\147\150\151\152\153\154\155\156\157" 
"\160\161\162\163\164\165\166\167\170\171\172\173\174\175\176\177" 
“\200\201\202\203\204\205\206\207\210\211\212\213\214\215\216\217" 


Text_save 返 回 聊 式 指 针 炎 型 Text_save_T 的 值 ， 其 中 Text_save_T 对 字符 申 空间 的 顶部 
(top) 进行 编码 。 该 值 以 后 可 以 传递 给 Text_restore 来 释放 在 Text_save_T 被 创建 时 所 分 配 的 
字 答 串 空间 部 分 。 如 果 h 是 Text_save_T 类 型 的 值 ， 则 测 用 Text_restore(h) 将 使 所 有 在 hb 之 后 创 
建 的 描述 符 和 Text_save_T 的 值 无效 。 将 一 个 
可 检查 的 运行 期 错误 。 而 使 用 这 些 值 将 会 产生 不 可 检查 的 运行 期 错误 .Text_save9J 以 引发 
异常 Mem_Failed。 


YText_save_T 传 递 给 Text_restore 将 会 产生 


些 重 要 的 特殊 傅 况 加 以 利用 ， 
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"\220\221\222\223\224\225\ 226\227\2 30\ 23 1\.232\233\234\235\236\237" 
"\240\241\242\243\244\245\246\247\250\251\252\253\254\255\256\257" 
"\260\761\262\263\264\265\266\267\270\271\272\273\274\275\276\277" 
"\300\301\302\303\304\305\306\307\310\311\312\313\314\315\316\317" 
"\320\321\322\323\324\325\326\327\330\331\332\333\334\335\336\337" 
"\340\341\342\343\344\345\346\347\350\351\352\353\354\355\356\357" 
"\360\361\362\363\364\365\366\367\370\371\372\373\374\375\376\377" 


const T Text.cset = ( 256, cset } 
const T Text ascii = { 127, cset } 
const T Text ucase = í 26, cset + 'A' }; 277 

















i 26, cset + 'a' }; 
const T Text digits = { 10, cset + '0' }; 
const T Text null i 0, cset }; 


Text 函 数 接受 指针 ， 但 是 将 它们 转换 成 字符 索引 以 便 能 访问 字符 中 中 的 字符 。 一 个 止 的 
位 置 通过 减 一 转换 成 索引 ， 而 一 个 非 负 的 位 普通 过 加 上 该 字符 市 的 长 度 而 转换 成 索引 ， 


const T Text_]case 


" 1 





(macros 278)= 
#define idx(i, len) (C) <= 0 ? Gi) + Cen) : (> - D 


相反 地 ， 一 个 索引 通过 加 一 转换 成 -个 正 的 位 置 ， 旭 Text_pes 的 实现 所 显示 的 那样 ， 在 
Text_pos 中 ， 先 将 位 置 参数 转化 成 索引 ， 然 后 再 将 索引 转化 凸 一 个 正 的 位 置 ， 
(functions 278)= 
int Text_pos(T s, int i) { 
assert(s.len >= 0 && s.str); 
i = idxGi, s.len); 
assert(i >= 0 && i <= s.len); 
return i + 1; 
} 
Text. pos #89 58 — assert rit 27” dici BOR HGR, Bok AEA Text T s 必 须 带 有 非 
负 的 len 域 和 非 空 的 str 域 。 第 二 个 assert 瑞 数 声明 是 位 置 1 一 一 玩 在 是 案 引 一 一 相应 于 s 中 的 有 
效 的 位 置 的 可 检查 的 运行 期 错误 、 和 如果 s 有 N 个 字符 ， 则 有 效 的 索引 是 从 零 到 N-_1 ， 但 评 有 效 
的 位 置 是 1 到 N+1l ， 这 就 是 为 什么 第 二 个 assert 芋 数 声明 有 N 个 索引 的 原因。 
Text_box 和 Text_sub 都 建立 和 返回 -个 新 的 描述 符 ， 





(functions 278)+= 
T Text box(const char *str, int len) { 
T text; 


assert(str); 

assert(len >= 0); 

text.str = str; 278 
text.len = len; 
return text; 








了 
Text_sub 与 此 类 似 , 但 是 它 必 须 将 它 的 位 时 参数 转换 成 案 引 以 便 能 计算 结果 的 长 度 ; 
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(functions 278)+= 
T Text. sub(T s, int i, int j) { 
T text; 


(convert i and j to indices in 0..s. len 279) 
text.len 2 j - i; 

text.str = s.str + i; 

return text; 


了 
如 上 所 示 ， 当 它们 从 位置 转换 成 索引 后 ， 在 i 和 j 之 问 有 j-i 个 字符 。 用 以 转换 的 代码 也 交换 i 
AN LATE FCR a nT PPAR SL 
(convert i and j to indices in 0..s. len 279)= 
assert(s.len >= 0 && s.str); 
i = idxGi, s.len); 
j = idxCj, s.len); 
ifj tint t= i; i=; jst: } 
assert(i >= 0 && j <= s.len); 
BGP SAE GL Bi Be EHS HR TR ER ERRI, TP H. "+ 5 14 EE B fy 
团 。 只 有 在 这 些 索 引 不 用 十 获取 或 者 存储 字符 时 才 不 使 用 <coryerti and j to indices in 
0..s.len 279> 。 例 如 ，Text_sub 只 使 用 它们 计算 并 始 的 位 置 和 长 度 、 其 他 的 Text 丙 数 只 有 在 
检测 到 和 j 是 有 效 的 索引 时 才 使 用 和 的 值 ， 
Text_put 和 Text_get 将 字符 中 复制 进 空间 或 者 从 空间 复制 出 字符 串 。Text 执 行 它 白 己 的 
分 配 函 数 *alloc(int len) 来 分 配 len 字 节 的 字符 中 空间 。 这 样 做 有 一 - 些 原 内 ， 第 一 ，alloc 不 使 
用 在 道 用 分 配 程序 中 使 用 的 存储 块头 部 ， 以 便 可 以 将 字符 中 相连 。 这 是 对 Text_dup 和 
Text_cat 壬 要 的 优 全。 第 一 ，alloc 可 以 避免 对 齐 (alignment )， 央 为 字符 没有 对 齐 限 制 。 S: 
JA, alloc 必须 同 Text_save 和 Text_restore 共 同 作 用 。 在 16.2.2 凶 中 将 开始 … 起 描述 alloc 、 
Text_save 和 Text_restore , 
Text_put 是 分 配 字符 串 空间 的 少数 典型 的 Text 两 数 。 它 调用 alloc 来 分 配 所 需 的 空间 、 将 
参数 字符 中 复制 到 分 配 的 空间 中 并 返回 适当 的 描述 符 : 
(functions 278}= 


T Text put(const char *str) í 
T text; 








assert(str); 

text.len = strlen(str); 

text.str - memcpy(alloc(text.len), str, text.len); 
return text; 





1 
Text_put 调 用 memcpy 而 非 strcpy ， 央 为 它 不 能 向 text.str rig iss ed 
Text getiERE BU ; VOL FIERA nb e RE BR SDRCU GC Bo 4pm. MECE BUS. 
符 趾 指针 为 空 ， 则 Text_get 调 用 Mem 的 通用 分 配 程序 来 为 字符 中 和 空 结束 符 分 配 空间 ; 
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(functions 278)+= 
char *Text_get(char *str, int size, T s) { 
assert(s.len >= 0 && s.str); 
if (str == NULL) 
str = ALLOC(s.len + 1); 
else 
assert(size >= s.len + 1); 
memcpy(str, s.str, s.len); 
str[s.len] = 'N0'; 
return str; 


H 
Text_get 调 用 memcpy 而 非 strmnepy， 因 为 它 必 须 复 制 出 现在 中 的 空 字符 。 
16.2.1 cf BRIE 


Text_dup 将 Text_T 的 参数 s 复 制 n 次 _ 


(functions 278)+= 
T Text dup(T s, int n) í 
assert(s.len >= 0 && s.str); 
assert(n >= 0); 
(Text_dup 281) 
} 


有 几 种 重要 的 特殊 情况 不 需要 对 s 的 mn 个 副本 进行 分 配 。 例 如 ， 如 染 s 是 守 字 符 由 或 者 n 等 
于 0 ， 则 Text_dup 返 同 - -个 补 的 字符 绅 ， 如 果 n 为 1 ， 则 Text_dup 就 返 Pls ; 


(Text dup 281)= 
if (n — 0 || s.len — 0) 
return Text nul]; 
if (n = D 
return s; 


如 果 最 近 已 经 创建 fs ， 则 s.str 可 能 位 十 字符 串 空 间 的 末尾 ， 即 ，s.str+s.len 可 能 等 于 下 

-个 帘 内 字 节 的 地 址 。 如 果 是 这 样 ， 则 只 需要 n -1 个 s、 因 为 初始 的 s 可 以 作为 第 一 个 备份 。 

在 第 16.2.2 节 中 定义 的 宏 isatend (s, n), HRES ES TEE HEB AE DR Fe. 还 检查 是 再 
有 了 能 容纳 至 少 n 个 字符 的 空间 。 


(Text dup 281)+= 


T text; 

char *p; 

text.Jen = n*s.len; 

if Cisatend(s, text. len - s.len)) { 
text.str - s.str; 
p = alloc(text.len - s.len); 
n--; 

) eise 
text.str = p = alloc(text.len); 

for ( ; n-- > 0; p += s.len) 
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281 memcpy(p, s.str, s.Jen); 
return text; 





J 
Text_cat 返 回 两 个 字符 串 s] 和 s2 相 连接 后 的 字符 串 。 


(functions 278)+= 
T Text_cat(T sl, T 52) { 
assert(sl.len >= 0 && sl.str); 
assert(s2.len >= O && s2.str); 
(Text_cat 282) 
} 


对 填 Text_dup ,有 一 些 重要 的 特殊 情况 可 以 避免 分 配 . 第 一 种 情况 是 s1 和 s2 中 有 一 个 为 空 时 ， 
Text-cat 就 可 以 只 返回 另外 一 个 宁 符 中 : 








{Text_cat 282)= 


if (sl.len 0) 
return 

if (s2.len 0) 
return s1; 





(Text. cat 2824 
if (sl.str + sl.len == s2.str) { 
si.len += s2.len; 
return sl; 


H 
SOAS] RY PAE AS RG, WIRGGIDEBUSZ. GM], OS SE EE MB. 


(Text_cat 282)+= 
{ 
T text; 
text.len = sl.len + s2.len; 
if Cisatend(s1, s2.len)) í 
text.str = sl.str; 
282 memcpy(alloc(s2.len), s2.str, s2.len); 


) else í 
char *p; 
text.str = p = alloc(sl.len + s2.len); 
memcpy(p, si.str, sl.len); 
memcpy(p + sl.len, s2.str, s2.]en); 





} 
return text; 


} 
Text_reverse 将 以 相反 的 顺序 返回 s， 它 只 有 两 种 至 凤 的 特殊 情况 ，s 为 闪 宇 答 串 时 和 内 
H—TTAW: 


(functions 278)+= 
T Text reverse(T s) í 
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assert(s.len >= 0 && s.str); 
if (s.len == 0) 
return Text. nu11; 
else if (s.len == 1) 
return s; 
else { 
T text; 
char *p; 
int i = s.Ten; 
text.len = s.len; 
text.str = p = alloc(s.len); 
while (--i 0) 
*p++ = Ss.str[i]; 
return text; 





} 

Text_map 的 实现 与 Str_map 的 实现 类 似 。 首 先 ， 它 用 from 和 to 字符 串 建立 一 个 映射 到 字 
符 的 数组 。 如 果 给 定 输 入 字符 c， 则 map [c] 就 是 出 现在 输出 字符 串 中 的 字符 。map 被 初始 化 
成 map [kj 等 于 k， 然 后 from 中 的 字符 被 用 来 案 引 map 中 的 元 素 ， 共 中 这 些 元 素 将 要 与 to 中 的 
相应 字符 一 一 对 应 ， 


(rebuild map 283)= 


int k; 

for (k = 0; k « Cint)sizeof map; k++) 
map[k] = k; 

assert(from-»len == to-»len); 


for (k = 0; k < from->len; k++) 
map[from-»str(k]] = to-»str[k]; 
inited = 1; 


femap RPO, disinited XI. .inited 用 米 实 现 可 检查 的 运行 戎 错误 ， 第 -次 调用 
Text_map 必 须 害 义 非 完 的 from 和 to 字符 串 ， 否 则 将 通过 inited 生 成 可 检查 的 运行 期 错误 。 


(functions 278)+= 
T Text_map(T s, const T *from, const T *to) { 
static char map[256]; 
static int inited = 0; 


assert(s.len »- 0 && s.str); 
if (from & to) { 
(rebuild map 283) 
} else í 
assert(from == NULL && to == NULL); 
assert (Cinited); 
} 
if (s.len == 0) 
return Text null; 
else { 
T text; 
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int i; 

char *p; 

text.len = s.len; 

text.str = p = alloc(s.len); 

for (i = 0; i < s.len; i++) 
*p++ = map[s.str[i]]; 

return text; 


| U" 


} 
了 


Str_map 不 需要 inited 标 点 ， 因 为 它 不 可 能 将 … 个 学 符 同 Str_map 中 的 空 字符 对 应 起 来 ， 
断言 应 明 map [at] 韭 零 就 足以 实现 可 检查 的 运行 期 错误 { 请 参见 15.3 节 相关 内 容 )。 然而 ， 
Text_map 人 允许 所 有 可 能 的 映射 ， 因 此 不 能 使 用 map 中 的 值 米 进行 错误 检查 - 

Text_cmp 比 较 字 符 申 s1 和 s2， 并 根据 s1 小 丁 s2 、s[ 等 于 82 和 8s1 大 士 s2 -种 情况 分 别 返回 小 
于 0 、 等 和 大 于 0 的 值 。 一 个 重要 的 特殊 情形 是 当 s1 和 s2 指 向 同 .个 字符 串 时 ， 得 的 字符 串 
将 小 于 长 的 字符 串 . 同样 地 ， 如 果 EEE AS A. D BOE RD, 


(functions 278)H= 
int Text_cmp(T sl, T s2) { 

assert(sl.len >= 0 && sl.str); 

assert(s2.len »« 0 && s2.str); 

if (sl.str == s2.str) 
return sl.len - s2.len; 

else if (sl.len < s2.len) í 
int cond - memcmp(sl.str, s2.str, si.len); 
return cond == 0 ? -1 : cond; 

) else if (sl.len > s2.len) { 
int cond = memcmp(sl.str, s2.str, s2.len); 





return cond == 0 ? 41 : cond; 
} else 
return memcmp(sl.str, s2.str, sl.len); 
H 
16.2.2 ”内存 管理 


Text 执 行 它 自己 的 内 存 分 配 程序 ， 以 便 它 能 利用 Text_dup 和 Text_cat 中 相 邻 的 字符 串 。 
虐 然 字符 申论 间 只 容纳 字符 ，Text 的 分 配 程序 也 可 以 避免 存储 块头 部 (block header) 和 对 
齐 问题 ， 这 样 就 可 以 节省 空间 -分配 称 序号 第 6 齐 讲 述 的 场 分 配 称 序 (arena allocator ) 的 一 - 
TRER. SERRE STALE A, CE PH ERR (chunk) 出 现在 从 
head 引 出 的 列表 中 ， 

(data 277) 

static struct chunk { 
struct chunk *link; 
char *avail; 
char *limit; 
} head = { NULL, NULL, NULL }, *current = &head; 
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limit 域 指向 存储 块 林 尾 乒 面 的 一 个 字 和 节 ，avail 指 向 第 一 个 空 举 字 节 ，link 指 向 下 一 个 任 铺 块 ， 
所 指向 的 这 些 字 节 或 者 存 储 块 都 是 空闲 的 。current 撕 向 当前 的 存储 让 ， 即 是 在 当前 存储 块 中 
分 配 的 决 。 上 述 定义 初始 化 current、 使 之 指向 :个 零 长 度 的 存储 块 ; 第 一 次 分 配 将 向 head 添 
Am RS CERE R 

alloc 从 当前 存储 块 中 分 配 len 个 字 节 ,或 者 分 配 一 个 至 少 10k 字 节 的 新 存储 块 : 


(static functions 286)= 
static char *alloc(int len) { 
assert(len »- 0); 
if (current-»avail + len > current-»limit) í 
current = current-»link = 
ALLOC(sizeof (*current) + 10*1024 + len); 
current-»avail Cchar *)(current « 1); 
current->limit = current-»avail + 10*1024 + len; 
current-»link = NULL; 


} 
Current->avail += len; 
return current->avail ~ len; 


} 
current->avail 足 字符 趾 空间 的 尾部 空闲 字 节 的 地 址 如 有 呆 s.str+s.len 等 十 current->avail , 
则 Text_T 型 的 s 册 现在 字符 串 空 间 的 尾部 ， 因 此 宏 isatend 定 义 如 下 : 


(macros 278)+= 
fdefine isatend(s, n) ((s).str+(s}.Jen == current->avail\ 
&& current->avail + (m) <= current-»limit) 


Text. dup f Text, cat HAE VUE Blk rint B 48 tas PAS lj 4 ERJA HURL (E PO az Id ERR 
HOF REB, HS PALS IRE AS EE Mfisatend i — 4 SH P 。 

Texf-_savye 和 Text_restore 为 客户 调 族 程序 提供 了 存储 和 恢复 字符 串 空 间 尾 部 位 置 的 方法 ， 
其 中 该 位 置 的 值 是 由 current 和 current->avail 的 值 确定 的 。Text_save 返 同 下 述 实 例 的 -个 隐 
式 指针 : 

(types 287)= 

struct Text save T í 
struct chunk *current; 


char *avail; 
F 


该 实例 中 带 有 current 和 current->avail 的 值 。 





(functions 27845 
Text_save_T Text save(void) í 
Text_save_T save; 


NEW(save) ; 

save->current = current; 
Save->avail = current-»avail; 
alloc(1); 





fas] 
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return save; 


H 
Text_save Ñ Halloc (1) 在 字符 中 空间 中 创建 一 个 “ 洞 《hole )"， 在 润 生成 之 前 ，isatend 无 
法 分 配 任 何 字 答 出 。 因 此 ， 字 符 囊 不 能 跨越 返回 给 客户 谐 用 程序 的 字符 事 补 间 的 尾部 。 
Text_restore 恢 复 current 和 current->avail 的 值 ， 释 放 当 前 块 后 面 所 有 的 存储 块 。 


(functions 278)+= 
void Text_restore(Text_save_T *save) { 
struct chunk *p, *q; 


assert(save && *save); 

current = (*save)-»current; 

Current-»avail = (*save)->avail; 

FREE(*save); 

for (p = current->link; p; p = q) í 
q = p-»link; 
FREE(p) ; 

Y 

current-»link = NULL; 

} 


16.2.3 SFER 


Hr Text SG 80 fb BRRR E, BERRAK SERAE B 
Text_chr 搜 索 一 个 字符 出 现在 s [ij] 中 最 左 端的 位 置 : 


(functions 278)+= 
int Text_chr(T s, int i, int j, int c) í 
(convert i and j to indices in 0..s. len 279) 
for C; i < j; i+) 
if (s.str[i] == c) 
return i + 1; 
return 0; 


Y 
如 果 s.str [i] 等 于 c， 则 i+1 就 大 s 中 都 个 字符 左面 的 位 置 ，Text_rchr 功 能 相近 ， 但 是 寻找 c 出 现 
的 最 右面 的 位 置 。 


(functions 278)+= 
int Text rchr(T s, int i, int j, int c) í 
(convert i and j to indices in 0..s. len 279) 
while Cj > í) 
if (s.str[--j] == c) 
return j + 1; 
return 0; 


i 
Text upto 和 Text_rupto 与 Text_chr 和 Text_rchr 功 能 也 类 似 ， 只 是 它们 搜索 一 个 字符 集合 
中 的 字符 出 现 的 位 置 ， 其 中 该 集合 是 由 Text_T 说 明 的 ; 
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(functions 278) 
int Text upto(T s, int i, int j, T set) í 
assert(set.]en >= 0 && set.str); 
(convert i and j to indices in 0..s. len 279) 
for Ci i < j; i++) 
if (memchr(set.str, s.str[i], set.len)) 
return i + 1; 

return 0; 


int Text rupto(T s, int i, int j, T set) { 
assert(set.]en >= 0 && set.str); 
(convert 1 and j to indices in 0..s. len 279) 
while (j » i) 
if (memchr(set.str, s.str[--j]. set.len)) 
return j + 1; 
return 0; 


H 
Str_apto 和 8$tr_rupto 使 用 标准 C 库 晒 数 来 检查 s 中 的 字符 是 否 出 现在 set 中 , Text 3⁄ RAE EAR 
strchr ， 因 为 S 和 set 都 可 能 包含 空 字符 ， 央 此 它们 使 用 memchr ，memehr 不 把 空 字符 解释 为 字 
符 串 的 结束 符 ， 

Text. find Text. rtind-3HR f Es [:] 中 出 现 的 位 置 ， 它 们 也 有 类 似 的 问题 ， Bee Ba 
数 的 Str 变 量 使 用 strnemp 比较 子 字符 中 ， 但 是 Text 函 数 必须 使用 memcmp ， 因 为 memcmp 能 处 
理 带 有 空 字 符 的 情况 - Text_find 使 用 memcmp 捍 索 str 络 定 的 字符 中 在 s [ij] 中 出 现 的 最 左面 
FAL. MALAY TE Gt str fs HE Bt Aste ERY OC A 








(functions 278)+= 
int Text find(T s, int i, int j, T str) { 
assert(str.len »- 0 && str.str); 
(convert i and j to indices in 0..s . len 279) 
if (str.len == 0) 
return i + 1; 
else if (str.len Det 
for C; i < j; ie) 
if (s.str[i] == *str.str) 
return i + 1; 





) else 
for ( ; i + str.len <= j; i++) 
if Cequal(s, i, str)) 
return i + 1; 
return 0; 


} 


(macros 278)+= 
#define equal(s, 7, t) \ 
Cmemcmp(&(s).str[i], (t).str, (t).1en) == 0) 


通常 情况 下 ，Text_find 不 能 检查 超过 s [ij | 的 字符 申 ， 这 是 循环 结束 的 At. 
Text_rfind 类 似 于 Text_find ， 个 是 它 搜索 str 出 现 的 最 右边 的 位 置 ， 从 而 避免 检测 出 现在 s 
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[i] 前 面 的 字符 。 


(functions 278)4= 
int Text rfind(T s, int i, int j, T str) í 
assert(str.len >= 0 && str.str); 
(convert i and j to indices in 0..s. len 279) 
if (str.len == 0) 
return j + 1; 
else if (str.len == 1) í 
while (j > D 
if (s.str[--j] == *str.str) 
return j + 1; 
} else 
for (i j - str.len >= i; j--) 
if Cequal(s, j - str.len, str)) 
return j - str.len + 1; 
return 0; 
} 


Text_any 打 描 s 中 位 本 i 右面 的 字符 ， 如 果 该 字符 出 现在 set'h 则 返回 Text_pos(s,i)+1。 


{functions 278)+= 
int Text_any(T s, int i, T set) { 
assert(s.len >= 0 && s.str); 
assert(set.len >= 0 && set.str); 
j = idx(i, s.len); 
assert(i >= 0 && i <= s.len); 
if Ci < s.len && memchr(set.str, s.str[i], set.len)) 
return i + 2; 
return 0; 
} 


dns [i] 在 set 中 ， 则 Text_any 返 回 i+2， 因 为 i+1 是 s [i] 的 位 置 ， 内 此 i+2 是 s [i] JE RO E 

Text_many 和 Text_rmany 经 常 在 Text_upto 和 Text_rupto 的 后 上面 调用 。 它 们 扫描 - .个 或 更 
多 个 出 一 个 集合 set 提 供 的 字符 并 返回 第 .个 不 在 集合 中 的 字符 的 左面 的 位 置 。Text_many 扫 
描 出 现在 s [i;j] 开头 的 字符 。 


(functions 278)+= 
int Text_many(T s, int i, int j, T set) í 

assert(set.len >= 0 && set.str); 

(convert i and j to indices in 0..s. len 279) 

if Ci < j && memchr(set.str, s.str[i], set.len)) { 
do 

ien 

while Ci « j 
&& memchr(set.str, s.str[i], set.Jen)); 
return i + 1; 

i 


return 0; 
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Text_rmany ff] 2c fTddiset juh SUES [ij] 尾部 的 一 个 或 更 多 的 字符 : 


(functions 278)4+= 
int Text_rmany(T s, int i, int j, T set) { 


1 


assert(set.len >= 0 && set.str); 
(convert i and j to indices in 0..s.1en 279) 


if (j > i && memchr(set.str, s.str[j-1], set.len)) f 


do 
— 
while (j >= i 
&& memchr(set.str, s.str[j], set.len)); 
return j + 2; 
} 


return 0; 


do-while 循 环 在 j 不 是 set 中 的 字符 的 索引 或 者 j 等 十 i-1 时 结束 。 第 一 种 情况 , j+2 是 导致 循环 
终止 的 字符 右面 的 位 着 ,因此 是 set 中 字符 左面 的 位 置 。 第 一 种 情况 , j+2 是 s [ij] 左面 的 位 置 ， 
其 中 s [ji 含有 set 中 所 有 的 字符 。 
ins [i] 从 str 给 定 的 字符 串 开 始 的 ， 则 Text_match 扫描 那个 字符 串 是 否 出 现 。 与 
Text_find 类 侯 ，Text_match 的 重要 的 特殊 情况 是 str 为 空 字符 串 时 和 str 只 有 一 个 字符 时 。 
Text_mateh 不 能 检测 s ij 外 面 的 字符 中 ， 下 面 第 二 个 这 条 件 确保 只 检查 s [i:j] 中 的 字符 。 


(functions 278)}+= 
int Text match(T s, int i, int j, T str) { 


H 


assert(str.len >= 0 && str.str); 
(convert i and j to indices in 0..s. len 279) 
if (str.len == 0) 
return i + 1; 
else if (str.len == 1) í 
if G < j && s.str[i] == *str.str) 
return i + 2; 
J else if (i + str.len <= j && equal(s, i, str)) 
return i + str.len + 1; 
return 0; 





Text rmatch 与 Text_match 类 似 ， 但 是 外 果 s [ij | VASE T RERBA, 则 它 返 回 str 中 字符 串 之 
前 的 位 置 。 注 意 不 要 检查 s [ij] 前 面 的 字符 。 


(functions 278)H= 
int Text rmatch(T s, int i, int j, T str) { 


assert(str.len >= 0 && str.str); 
(convert i and j to indices in 0..s. len 279) 
if (str.len == 0) 
return j 4 1; 
else if (str.Ten == 1) í 
if (j > i && s.str[j-1] == *str.str) 
return j; 
} else if (j - str.len >= i 
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&& equal(s, j - str.len, str)) 
return j - str.len + 1; 
return 0; 


} 


16.2.4 转换 函数 


最 后 c RUKCRText fmt. EE Ro EE PR HRK. Fmt S 3 (9 ER E — e f HL 
Text_fmt 用 于 以 与 printf 的 %%s 格 式 相同 的 样式 打印 Text_T- "Iz HFEmt puts, Fmt puts 
Text. T XE / flags ，width 和 precision ， 方 式 printf ACFE RE LY LH 

(functions 278)+= 

void Text fmt(int code, va.list *app, 
int putCint c, void *c1), void *c1, 
unsigned char flags[], int width, int precision) { 
T *s; 


assert(app && flags); 
s = va.arg(*app, T*); 
assert(s && s->len >= 0 && s-»str); 
Fmt puts(s-»str, s-»len, put, cl, flags, 
width, precision); 
H 
不 同 Flext H rp Bot PEE BUR, Text fmt -个 指向 Text_T 的 指针 ， 而 不 是 
Text TAS, Text TÍR. —B SB K. MERTER AAE 00238 POT A He 
参数 列表 中 的 双 精 度 型 之 间 的 区 别 的 。 办 此 ， -此 C 实 现 不 能 通过 叮 变 攻 度 参数 列表 的 值 来 
RA FES A. 传递 Text_T 指 针 在 所 有 的 实现 中 避免 『 这些 问 题 。 


参考 书目 浅 析 


Text_THISNOBOL4 (Griswold 1972 ) 和 Icon ( Griswold 和 Griswold 1990 ) 在 语义 和 实 
现 上 都 足 类 似 的。 这 两 种 语言 都 是 通用 的 、 宁 符 串 处 理 的 语言 ， 并 且 邦 有 与 Text 华 出 的 消 数 
340 HA GE 

3 DLE 25 AAEE P (E rp OQ OR ESI A FA VES ATE oS SAEI UE S 1H 00 007 7 
中 。XPL 编 译 器 发 生 基 (McKeeman，Horning 和 Wortman1970 ) 是 -个 早期 的 例子 ,在 识别 
Text_T 的 系统 里 ， 无 用 单元 收集 程序 来 处 理 字符 串 空间 。Icon 用 XPL 的 无 用 单元 收集 程序 来 
回收 没有 被 任何 已 知 的 Text_T (Hanson 1980 ) 所 引用 的 字符 申 空 间 。 它 通过 将 Text_T 复 制 
到 字符 串 空 间 的 开始 部 分 来 使 字符 中 变 得 紧凑 。 

Hansen (1992) 描述 了 字符 申 的 - -个 完全 不 同 的 表述 方法 ， 在 该 字符 申 中， 一 个 子 字符 
申 拱 述 符 带 有 足够 的 信息 来 恢复 它 所 雇 的 较 大 的 字符 串 。 这 种 表示 方法 使 得 在 其 他 事物 PH 
向 左 或 者 向 右 扩展 字符 串 成 为 可 能 。 


高 红字 


# 215 





“rope” 22k - ANTE PRK, ORAR rik, KAR To PP 
表示 (Boehm, Atkinson 利 Plass 1995 )、 在 rope 中 的 字符 可 以 在 线性 时 间 内 移动 ， 就 像 那 些 
在 Text_T 中 的 字符 或 者 在 C 宁 符 串 中 的 字符 那 伴 ， 但 是 子 字符 串 操作 将 比 并 对 数 时 间 。 但 是 
它 的 连接 速度 快 得 多 : IEEE rope tE VE Jen ti In], 03 FR TEE IHRU FPE LC rope uf 
以 由 一 个 能 产生 第 i 个 字符 的 函数 来 描述 - 


练习 


16.1 
16.2 


16.3 


16.4 


16.5 


使 用 Text 随 数 重新 写 第 15.2 广 中 讲述 的 ids.c。 
Text-_save 和 Text_restore 并 不 十 分 完善 。 侧 如 下 面 的 序列 是 错误 的 ,但 足 没有 被 
检测 到 。 

Text_save_T x, y; 

x = Text.save( ; 

y= Text_save(); 


Text restore(&x); 


Text. restore (ay); 
ARIText_restore(&x) ZG, YARIS. FUR EH RAD Hex QU BJ -个 字符 中 空间 
BER o KEBCTextiA BO, LAR AER WENA HIR 

Text save RIText, restore H fei HERESKAY SAC. JG FL ocu SERE NTT e RE df se, 
但 是 舌 要 已 知 所 有 是 以 访 冲 的 Text_T。 设计 一 个 Text 两 数 的 扩 恢 版本， 使 它 包 含 
TEMText_T 4 HK fü Text compact A, Hj'Text. compact jg ft f] HjHanson 
(1980 ) 中 摘 述 的 方法 将 所 有 已 经 注册 的 Text_T 所 引用 的 字符 再 放 到 字符 由 空间 
的 开始 部 分 ， 从 而 回收 被 没有 注册 的 Text_T 所 占用 的 空间 . 

将 搜索 字符 毕 的 丽 数 如 以 扩展 ， 比 如 Text.find 和 Text_mateh ， 使 它们 接受 的 
Text_T 了 可 以 指定 正则 表达 代 而 不 仪 仪 是 字符 中。Kernighan 和 Plauger ( 1976 ) Hh 
述 了 正则 表达 式 和 匹配 它们 的 自动 机 的 实现 ， 

基于 Hansen (1992 ) 所 描述 的 子 字符 中 模型 ， 设计 一 个 接口 和 实 


E 
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32 位 整 型 格式 的 计算 机 能 够 表 不 从 -2 147 483 648 到 +2 147 483 647 的 有 符号 整数 (用 2 
的 补 码 表 示 ) 和 从 0 到 4 294 967 295 的 无 符号 整数 ， 这 样 的 范围 对 十 大 部 分 应 用 程序 来 说 ， 
已 经 足够 大 了 ,但 是 也 有 一 些 应 用 程序 需要 上 蝎 大 的 范围 。 在 相对 紧 凌 的 数值 范 由 里 ， 整 型 表 
示 每 一 个 整数 值 。 而 在 极 大 的 数值 范围 里 ， 序 点 数 表 示 相 对 较 少 的 值 , 仪 当 可 以 接受 精确 值 
的 近似 时 ， 才 能 用 浮 点 数 。 和 如同 在 省 多 科技 应 用 中 那样 ,但 当 需 要 很 大 的 数值 范围 里 折 有 的 
Bea, MARL. 

本 章 表述 了 -个 低级 接口 ，XP ， 其 导出 的 函数 针对 在 固定 精度 的 扩展 整数 上 的 算法 运 
算 。XP 表 示 值 的 范围 仪 局 限于 所 利用 的 存储 器 的 大 小 。 此 接口 被 设计 用 来 服务 于 下 两 章 将 
会 讨论 到 的 高 级 接口 。 在 那些 需要 用 到 潜在 的 极 大 数值 范围 里 的 整数 的 应 用 程序 中 ， 将 会 用 
到 这 些 接口 。 


17.1 接口 


一 个 "位 无 符号 整数 x 可 出 多 项 式 xo x, bn + yg bt +. to b+ 0 表示， 在 这 里 b 为 底 
数 且 0<%i<b。 在 有 普 32 位 无 符号 整 型 格式 的 计算 机 上 ，n 是 32，# 是 2， 并 且 用 32 位 中 的 一 位 表 
不 系数 x:。 此 种 表 水 能 被 推广 表示 在 任何 底数 下 的 一 个 无 符号 鳌 数 。 例 如 ， 如 果 b 是 10， 孝 么 
每 个 是 0 到 9 之 间 的 一 个 数 ， 并 日 x 能 用 一 个 数组 表示 ， 比 如 用 数组 表示 数字 2 147 483 647, 

unsigned char x[] = í 7, 4, 6, 3, 8, 4, 7, 4, 1, 2 J; 

PKH [i rx. Beryx tB Ex BL. JE B U BE OT FS, OR ADR SEB BE HR 
作 最 便利 的 排序 方式 。 

选择 较 大 的 底数 可 以 节省 存储 器 窍 其 ， 因 为 底数 武大 ， 数 宁 也 就 越 大 。 例如， 如 果 8 是 
25= 65 536， 那 么 每 一 个 数 宁 是 0 到 包括 65 535 之 间 的 一 个 数 ， 因 此 仅 需 要 两 个 数字 ( 四 个 
FH ) 来 表示 2 147 483 647. 

unsigned short x[] = { 65535, 32767 }; 

以 及 64 位 数字 

349052951084765949147849619903898133417764638493387843990820577 

可 由 上 只 有 14 个 无 素 〈28 个 字 节 ) 的 数组 表 水 : 


{ 38625, 9033, 28867, 3500, 30620, 54807, 4503, 
60627, 34909, 43799, 33017, 28372, 31785, 8}. 
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DROE, Jf HK 的 位 数 大 小 是 C 中 预先 定义 的 无 符号 整数 类 型 的 种 ,那么 用 较 小 
的 底数 就 会 节省 空间 。 市 县 也 许 更 为 重要 的 足 ， 大 的 底数 会 使 一 些 算法 操作 实现 起 来 更 为 复 
d. 如 下 面 详 述 的 那样 ， 如果 “个 万 符 号 长 整数 能 够 保存 所 -1 ， 闭 么 就 能 避免 这 些 复杂 操作 。 
XP 使 用 的 足 b=2s 并 且 存 储 一 个 无 符号 字符 里 的 每 一 位 ， 这 是 因为 标准 C 保 证 个 无 符号 长 字 
符 至 少 有 32 位 ， 其 中 至 少 保存 3 个 字 节 ， 因 此 …- 个 大 符号 长 字符 能 够 保 在 值 靖 -1=22 -1。 用 
b=23， 由 个 字 节 就 可 以 表示 值 2 147 483 647; 

unsigned char x[] = { 255, 255, 255, 127 }; 
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27 个 宁 节 就 可 以 表 不 如 .上 所 东 的 64 位 数学 : 


Í 225, 150, 73, 35, 195, 112, 172, 13, 156, 119, 23, 214, 151, 17. 
211, 236, 93, 136, 23, 171, 249, 128, 212, 110, 41, 124, 8 1. 


XP 接 口 揭示 了 下 面 的 表示 细节 


(xp. Ws 
#ifndef XP. INCLUDED 
#define XP. INCLUDED 


#define T XP. T 
typedef unsigned char *T; 


texported functions 299) 


#undef T 
Xendif 


KAWDE, XP TR TOME GERR, PREVA AIRRA CR ETATE BT. 
以 下 描述 的 XP 函数 部 把 作为 输入 参数 ，XP_T 作 为 输入 输 出 参数 ， 数 组 必须 足够 容纳 n 
个 数字 。 如 果 向 接口 传送 一 个 从 XP_T ,或 者 传送 的 这 个 XP_T 太 小 ,或 者 其 没有 古 正 的 攻 度 ， 
那么 会 产生 不 可 检查 的 运行 期 错误 。XP 是 一 个 危险 的 接口 ， 内 为 它 忽略 了 上 多数 可 检查 的 运 
行 期 错误 。 进 行 这 样 的 设计 有 两 方面 的 京 岂 - XP EE, Y de 
销 误 也 许 其 自身 会 实现 可 检查 的 运行 期 错误 ,第 ， 如 果 必 须 考 虑 性 能 的 话 ，XP 的 接口 应 
尽 可 能 的 简单 ， 这 样 一 些 陶 数 可 以 用 汇编 诸 言 实现 第 二 个 因 夫 也 足 为 什么 XP 的 任何 函数 
都 不 进行 分 配 操作 的 原因 。 
DE 
(exported functions 299)= 
extern int XP add(int n, T z, T x, T y, int carry); 
extern int XP .sub(int n, T z, T x, T y, int borrow); 
实现 了 z=x+y+carry 和 z=x-y-borrow， 这 里 和 以 下 的 5 y 和 z 指 的 总 数组 x 、 y Füz d zr üt s 
数值 ， 它 们 被 认为 含有 n 位 数 。carry 和 borrow 必 须 为 0 或 1 ,XP_add 用 数组 zf0..n-1] 来 保存 n 
BERI x+y+carry ,并 返回 最 终 进 位 的 好 高 有 黎 位 ，XP_sub 用 数 织 z[0..0-1] 来 保存 n 位 求 差 
X--borrow， 并 返回 最 终 借 位 的 走高 有 效 位 ， 因 而， 如 果 XP_add 返 四 1 ， Hb Axtytcanry PHL Fin 
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AME, MRXP_subiWAl, Bay>x,, HRA MPR, PPL, ydüz. UD CTI 
一 个 XP_T 并 不 足 一 个 错误 。 


(exported functions 299)+= . 
extern int XP mul(T z, int n, T x, int m, T y); 


实现 z=z+x oy, R Exfin CE. YAMPA P. CUM EBM AUR dinem CE: 
XP_mul 将 z 加 上 nt+m 位 数字 的 乘积 x y， 并 把 结 杂 赋 子 z ， 当 z 被 初始 化 为 0 时 ，XP_mul 用 数 
组 z[0..n+ 台 -]] 米 保存 x&，y，XP_mul 返 回 n+ 和 位 数字 乘积 最 终 进 位 的 最 高 有 效 位 。 对 于 z 来 说 ， 
ANSE jx sy A H [1A XP. 了 T 则 会 产 牛 不 可 检查 的 运 comm. 

XP_mul 卫 明了 在 何 处 const 限 定 词 是 以 帮助 区 分 输入 和 给 出 参数 并 记录 这 些 类 型 的 运行 
期 错误 。 占 明 


extern int XP mul(T z, int n, const unsigned char *x, 
int m, const unsigned char *y); 


EXP molik, yA ZA RUE IU TAB ， 央 而 指出 z 不 应 该 5x 或 y 相 同 。x 和 y 不 能 用 const 
了 ， 因 为 const T 4 是 “指向 一 个 无 符 吕 字符 的 常量 指针 "“， 而 不 是 想 要 的 “指向 -个 无 
符号 常量 字符 的 指针 ”( 见 2.4 闻 相关 内 容 定义 )。 练习 19.5 研 究 了 其 他 Je E fat const T 
的 定义 ， 

然而 ， 内 为 一 个 无 符号 char* 能 够 传递 给 const 无 符号 char* ， 所 以 const 限 定 符 不 能 阻止 
传递 与 5 和 z ( 或 者 y 和 z ) 相同 的 XP_T。 人 是 const 的 用 法 却 允 许 -个 const 无 符号 char* 传递 x 
Aly: 在 以 上 针对 XP_mul 的 XP 的 声明 里 ， 必 须 用 类 型 强制 转换 米 传递 这 些 值 、 在 Xb 中 ， 
const 的 请 大 好 处 并 不 能 抵消 它 的 元 长 。 

Ep 





(exported functions 299)+= 
extern int XP.divCint n, T q, T x, int m, T y, T r,T tmp); 


实现 了 除法 : 它 计算 了 q=x/y 和 r=x mod y; gd 利 x 有 n 位 数 ,rf 和 y 有 四 位 数 。 如 果 y 等 于 0 ， 
XP_div 返 四 0 并 保持 9 和 r 不 谈 。 和 再 则 ， 将 返回 1 tmp 必须 宇 少 能 够 有 n+m+2 位 数 。q 战 7 足 x 或 
了 中 的 一 个 、q 和 r 有 相同 的 XP_T， 或 者 mp 太 小 ， 以 上 这 些 情况 都 会 产生 不 可 检查 的 运行 期 
错误 。 

函数 


(exported functions 299)+= 
extern int XP. sum Cnt n, T z, T x, int y); 
extern int XP. diff Gnt n, T z, T x, int y); 
extern int XP product (int n, T z, T x, int y 
extern int XP. quotient(int n, T z, T x, int y); 


实现 了 加 法 、 减 法 REMA — en (XP. T BER OS 2^ AUB BEY RU BRIE | XP. sum RUSH 
z[0..n-1] f frx-ey 3E iR F| e Z AR m lu : XP. diff H] SED z [0.2 -1] f Zex -y Jf 3R E| fik 
终 借 位 的 最 高 有 效 位 。 对 于 XP_sum fXP. dift, Y 必 须 为 雍 并 日 不 能 想 出 共 底数 2*。 
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XP_product 用 数组 z[0..n-1] 保 存 x* y 并 返回 最 终 进位 的 最 高 有 效 位 ; 进位 可 能 与 28-]1 一 
样 大 。XP_quotient 用 数组 z[0..n-1] 保 存 x/y 并 返回 ,x mod y; 余数 能 与 y -1 一样 大 - 对 于 
XP_product 和 XP_quotient 来 说 ，y 不 能 超过 28-1 , 


(exported functions 299)+= 
extern int XP_neg(int n, T z, T x, int carry); 


XP. neg 用 数组 z[0..n-1] 保 存 ~x+carry 并 返回 最 终 进 位 的 最 高 有 效 位 。 当 carry XO BJ. XP. neg 
实现 了 一 个 数 的 取 反 ， 当 carry 为 1 时 ，XP_neg 实 现 了 一 个 数 的 补 码 。 
XP_T 串 以 通过 函数 XP_emp 进行 比较 
(exported functions)+= 
extern int XP cmpCint n, T x, T y); 
PIR ADF, SERA TOM. PR ix<y 、x=y 或 x>y。 
XP_T 能 通过 以 下 函数 进行 移 位 操作 
(exported functions 299)+= 
extern void XP_IshiftCint n, T z, int m, T x, 
int s, int fill); 
extern void XP rshift(int n, T z, int m, T x, 
int s, int fill); 
函数 将 把 左 移 或 右 移 s 位 的 x 的 值 赋 给 z ， 这 电 z 有 n 位 数字 ，x 有 m 位 数字 。 当 n 超 出 m 时 ， 因 x 
最 高 有 效 位 的 移动 而 所 需 的 填充 值 ， 如 果 石 移 就 等 于 0 ， 如 果 左 移 就 等 Tfill 值 。 空 出 位 由 fi 
来 填充 ， 必须 等 于 0 或 1 。 当 fi 为 0 时 ，XP_rshift 实 现 一 个 逻辑 右 移 ， 当 fill 位 18j ，XP_rshift 
能 被 用 来 实现 一 个 算术 右 移 。 


(exported functions 299)+= 
extern int XP length Cint n, T x); 
extern unsigned long XP_fromint(int n, T z, 
unsigned long u); 
extern unsigned long XP.toint (int n, T x); 


XP_length 返 回 x 里 的 数字 位 个 数 ; 就 是 说 ， 它 返回 数组 xl0..n-1] 里 的 最 高 有 效 非 0 位 的 索 
引 值 加 1。XP_fromint 用 数组 z[0..n-1] 保 在 u mod 2°" f: llu/2", PILE, WGI AE TPL 
在 z 里 的 u 的 位 数 。XP_toint 返 回 x mod (ULONG_MAX+1); 就 是 说 ， 心 返回 的 足 x 里 的 
8 - sizeof(unsigned long) Ay Ae (RAT Afi. 

剩 下 的 XP 函 数 可 以 在 字符 串 和 XP.T 之 间 进 行 转换 。 


(exported functions 299) 
extern int XP. fromstr(int n, T z, const char *str, 
int base, char **end); 
extern char *XP tostr (char *str, int size, int base, 
int n, T x); 


XP. fromstr {RCE BCP fistrtoul ; È feste E EAT s 4 (EE base 为 底数 的 “个 无 符号 整数 . 
它 忽 略 引导 宗 白 符 ， 并 接受 以 base 为 底数 的 一 个 或 更 多 的 数字 - 对 于 11 和 36 之 间 的 底数 ， 
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XP_fromstr 把 大 写 或 小 写 的 字符 当 作 大 于 9 的 数 宁 。 如 果 底 数 base 小 于 2 或 者 大 于 36， 就 会 产 
生 可 检查 的 运行 期 错误 。 
n 位 数 的 XP_T ，z， 利 用 各 用 的 信 增 算法 米 累加 str 里 的 指定 整数 : 


for (p = str; *p is a digit; p++) 
z< base-2+ *p's value 


z 不 初始 化 为 0; 客户 必须 正确 地 初始 化 z: 。XP._fromstr 返 回 base - z 乘 积 最 终 进位 的 第 一 个 非 
0 值 ， 香 则 返回 0。 央 再， 如 果 数字 不 能 在 放 丰 数 组 2 里， 那么 XP_fromstr 就 会 返回 最 终 进 位 
的 非 0 值 。 

如 果 end 非 空 ， 出 十 可 以 打 描 到 乘法 谥 出 和 是 否 为 数字 ,那么 分 配给 xend 的 指针 就 指向 
结束 XP_fromstr 解 释 执 行 的 字符 、 如 果 str 里 的 宁 符 不 是 以 base 为 底数 的 “个 整数 并 且 如 果 
end, 那么 XP_fromstr 就 会 返回 0， 并 设 管 *end 为 str。str 如 朵 为 空 住 ， 就 会 产生 串 检查 
的 运行 期 错误 。 

XP_tostr 用 含 空 终 中 字符 的 字符 捉 来 填充 str， 这 些 字符 叫 足 以 base 为 底数 的 数 宁 x 的 字符 
表示 XP tost A MA Estre Tix WE AHO. YE Mbase TION. TWA SS oe 
不 超出 9 的 数字 。 如 果 底 数 base 小 十 2 或 者 大 十 36 ， 就 会 产生 RAZITA AR. AOR sty 
空 、 或 者 size 太 小 ， 也 会 产生 可 检查 的 运行 期 错误 ;就 是 说 ， 如 果 x 的 字符 表示 加 上 一 个 空 字 
符 要 求 了 大 于 size 个 字符 空间 会 产生 9] 恰 查 的 运行 期 错 澡 。 


17.2 实现 


(xp.c)= 
#include <ctype.h> 
#include <string.h> 
#include "assert.h" 
#include "xp.h" 


#define T XP_T 
#define BASE (1««8) 


(data 320) 
(functions 304) 


XP. fromintfllXP. toin, f iX 63S MXP 函数 必须 执行 的 算术 操作 ，XP_fromint 初 始 
化 一 个 XP_T ， 使 得 XP_T 等 同村 -AER 0 Kommt. 


(functions 304)= 
unsigned long XP_fromintCint n, T z, unsigned long u) í 
int i = O; 


do 

z[i++] = u%BASE; 
while ((u /= BASE) > O && i < n); 
for (Ci i < n; i++) 
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z[i] = 0; 
return u; 
} 
U%BASE IPA iss 8209. DOR Bez] SP BOE DERE. A XP EE RR AB w. 
ORE Tut RR IE. WO ER ENIA SUS SEX BU Jc HITS IU EL A. < 
BRAT TG. RIE MU ie BOR BUH COGO AS. EUER BOE BEST S 
XP_toint /£XP. fromint 8] 3E pf fe: 它 返 回 作 为 无 符号 长 整 型 的 XP_T 的 8，sizeof 
(unsigned long) 的 最 低 有 效 位 . 
(functions 30445 
unsigned long XP toint(int n, T x) í 
unsigned Tong u = 0; 
int i = Cint}sizeof u; 
if G > n) 
i <= n; 
while (--i >= 0) 
u = BASE*u + x[i]; 
return u; 
i 
当 “个 非 0、a 位 的 XP_T 有 -个 或 更 多 的 引导 0 时 ， 它 的 有 效 位 数 小 Fn。XP_tength 返 加 
有 效 数 字 的 个 数 ， 而 不 计算 引导 0 的 个 数 , 
(functions 3044 
int XP. length(int n, T x) í 
while (n » 1 && x[n-1] -- 0) 
n--i 


return n; 


17.2.4 加 法 和 减法 


实现 加 减 的 算法 是 笔算 技术 的 系统 再 坝 - 一 个 底数 为 10 的 例子 最 有 效 地 说 明了 加 法 


Z=x+y: 


TI AA Reef FTIR THE AG — É Ja BR AT Sk fr, AH, CELEB, BERL HO, ob 
形成 总 和 $=carry+xtty; 为 8 mod b, BAUER ALS, CEI, ph 10. Ei Fu —fi 
By OF FATE SA. ERRET -Ai B ESHT. TEE BE. ARES BEGET, ， 这 
EA AS ALA RT J 央 位 数字 。XP_add 准 确 执行 了 此 算法 .并 且 返 同 了 最后 的 进 信 值 。 
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(functions 304)+= 
int XP.add(int n, T z, T x, T y, int carry) í 
int i; 
for G 20; i «nm i++) { 
carry += x[i] + yli]; 
z[i] = carryXBASE; 
carry /= BASE; 
J 
return carry; 


} 
在 每 一 次 反复 执行 加 法 的 运算 中 ，carry 和 暂时 保存 了 单位 位 数 数字 总 和 5; WA CERE 
好 保存 了 进位 值 。 每 一 个 数字 是 0 到 5b 五 之 间 的 一 个 数 ， 并 入 进位 值 可 以 必 0 或 1， 因 此 (b-l) 
*(b-D+1=2b-1=5112 ~ 个 单位 位 数 数字 总 和 的 最 大 值 ， 很 容易 保 在 在 -个 整 型 中。 
减法 、z=x-y， 类 似 于 加 法 ; 





01100 
942 8 
一 7 3 2 
18 06 09 16 


减法 从 最 低 有 效 位 进行 减法 -- 直 到 最 高 有 效 位， 在 此 例 里 ， 借 位 的 初始 化 但 是 9， 和 鲜 - - 步 形 
JB ZED-x;&b borrow-y,; zi 是 D mod b、 新 的 借 位 信 是 1- Dib。 在 最 上 面 ” 行 的 小 数字 是 借 
位 值 ， 在 最 底下 -- 行 的 电位 位 数 数 宁 足 厂 的 值 。 
(functions 304) 
int XP sub(int n, T z, T x, T y, int borrow) í 
int i; 
for (i20; i «ni ie) £ 
int d = (x[i] + BASE) - borrow ~ y{i]; 
z[i] - dXBASE; 
borrow = 1 - d/BASE; 
} 
return borrow; 
} 
DD 至 多 为 (bp-1) +B-0-0=29-1=511， 可 以 保存 在 一 个 整 型 中 -如 果 最 后 的 贷 位 非 D， 那 么 x 
小 于 y。 
单位 位 数 数字 的 加 法 和 减法 比 许多 通用 函数 绝 简 单一 点 ， 并 且 它 们 用 第 一 个 操作 数 作为 
进位 或 借 位 。 
(functions 304)+= 


int XP_sum(int n, T z, T x, int y) í 
int i; 


for (i = 0; i < n; i++) { 





Bs] 
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y += x[i]; 
z[i] = y%BASE; 
y /= BASE; 
} 
return y; 
H 
int XP. diffCint n, T z, T x, int y) í 
int i; 
for (i = 0; i < n; i+) í 
int d = (x[i] + BASE) - y; 
zfi] = dXBASE; 
y = 1 - d/BASE; 
} 
return y; 
} 


XP_neg 同 一 位 数 宁 加 法 类 似 ， 但 是 在 做 如 法 之 前 ，x 的 数字 已 被 求 补 : 


(functions 304)+= 
int XP. negCint n, T z, T x, int carry) { 
int i; 


for G = 0; i < n; i++) { 
carry += (unsigned char)-x[i]; 
z[i] = carryXBASE; 
carry /- BASE; 


} 
return carry; 


} 
RAKE RRA RT [i] Tb, 


17.2.2 Rik 


如 果 x 有 ?位 数字 ，y mT, WS Arex «yn RA RR | BB in Be 
F, Eon ETE RAR A, em Fe RSS PR 了 当 z 的 初始 值 为 0 时 ，n=4 和 m=3 
的 乘法 过 程 ; 





7 3 2 
x 9 4 2 8 
5856 
1464 
29258 
+ 6 5 8 8 
69 01229 6 


MARAE DERE: SH RRMA MEN, ROR UIA SI fz 里 。 例 
如 ， 在 第 一 个 部 分 乘积 的 数 定 里 ,8 . 732， 从 最 低 有 效 位 计算 到 最 高 有 效 位 。 按 照 加 法 里 一 
艇 的 进位 运算 ， 部 分 乘积 的 第 位 数字 加 到 了 z 的 第 ! 位 数字 . 第 一 个 部 分 乘积 的 第 i 位 数字 ， 
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2.732, WME TABH RF. cm. PPE Rx OMAR, EM A Ble Pay 
位 置 开 始 于 z 的 第 ;位 。 


(functions 304)+= 
int XP_mul(T z, int n, T x, int m, T y) í 
int i, j, carryout = O; 


for G = O; i «n; i++) í 
unsigned carry = 0; 
for G = 0; j < j++) í 
carry += x[il*y[j] + z[is3li 
zli+j] = carry%BASE; 
carry /= BASE; 





for (; j<n+m- i; j+) í 
carry += z[i+j]; 
z[i+j] = carry%BASE; 
carry /= BASE; 


carryout |= carry; 
} 
return carryout; 
} 
当 部 分 乘积 中 的 数字 在 第 - SR ER ILA SU Pe 上 时 ， 进 售 最 大 可 与 -1 一 样 大 ， 因此 在 
铺 在 carry 里 的 总 和 能 与 (5-1) (b-1)+(b-1)=b2-b=65 280 一 样 大 ， 它 被 保存 为 无 符号 数 。 在 
把 部 分 乘积 加 人 到 z 后 ， 第 二 个 符 套 鼻 环 把 进位 加 和 人 到 z 中 惠 余 的 数字 寺中， 并 记录 在 当 次 如 
法 中 形成 的 z 的 最 高 有 效 本 位 的 进位 值 。 如 果 进 位 一 直 等 十 1 MAr "3 的 最 终 进位 等 于 1 ; 
一 位 数字 乘法 等 同 十 调用 XP_mul ，m 等 于 1，z 初 始 化 为 0 : 
(functions 304)+= 
int XP_product(int n, T z, T x, int y) { 
int i; 
unsigned carry = 0; 





for G = 0; i < n; i++) í 
carry += x[i]*y; 
z[i] = carryXBASE; 
carry /- BASE; 

} 

return carry; 


) 
17.2.5 除法 和 比较 


除法 是 最 复杂 的 算术 函数 。 有 若 等 法 可 以 用 来 完成 除法 设计 .但 每 一 种 算法 都 有 各 自 
PE Ec CNRC RE RUA F AE UU PER HORE GE HO. xc HL E PR gery 
和 r=x mod y 米 实现 - 
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ifx<ytheng0,rex 
else 
g c x/2y,  — x mod 2y 
fr < y then g —2g,rerelseg 2g «lr r-v 


"RR. P g 和 7 的 中 间 计 算 过 程 必须 利用 XP_T 来 实现 、 

利用 递归 算法 的 问题 是 如 何 对 8 和 关 进 行 分 配 . A g x (以 2 为 底 的 对 数 ) 是 最 大 的 递 
归 深 度 ， 所 以 这 些 分 配 与 8 x 值 一 样 多 ，XP 接 口 焦 止 这 些 隐 式 的 分 瑟 - 

在 通常 情况 下 ， 当 xy 以 太 y 至 少 有 是 个 有 有效 位 时 、XP_div 采 用 了 效率 很 高 的 迭代 算 
法 ， 当 x<y 以 及 y 有 -位 误 效 数字 时 ， 针 对 这 种 较 容易 的 情况 、XP_div 使 用 了 -种 史 为 简单 的 
算法 。 





(functions 304)4= 
int XP_div(int n, T q, T x, int m, Ty, T r, T tmp) ( 
int nx = n, ry = m; 


XP.length(n, x); 
XP. Tength(m, y); 
f (m = 1) í 
(single-digit division 311) 
j else if (m > n) í 
memset(q, 'NO', nx); 
memcpy(r, x, n); 
memset(r + n, ‘\O', my - n); 
} else { 
(long division 312) 


n 
m 
i 


H 


return 1; 
1 
XP div BGS AE -人 数字 除法 dui D Eh OOH. 
位 数字 除法 很 简单 ， 因 为 它 使 用 了 C 语 言 中 通用 的 无 符号 整数 除法 来 计算 商 值 。 除法 
从 最 高 有 效 位 计算- 丰 进 行 划 最 低 有 效 位 ， 进 位 的 初始 信 是 0 。 以 10 为 底数 ，9 428 与 7 相 除 
按 以 下 步 台 所 孙 





在 每 一 步 中 ， 部 分 被 除数 R=carry - brx; 商 倘 gF=R/yo， 新 的 进位 足 R mod yos atr f e 
上 面 的 小 数字 ， 进 位 的 最 后 值 尾 余 数 。 除 法 操作 由 XP_quottent 准 确实 现 ， 并 返回 余数 : 
(functions 304) 
int XP.quotient(int n, T z, T x, int y t 
int i; 
unsigned carry - 0; 


for G =n- 1; i >= 0; i--) { 
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carry = carry*BASE + x[i]; 
z[i] = carry/y; 
carry %= y; 

} 


return carry; 


} 
R—xXP_quotient'#fcarry [Ei 
号 数值 ， 

TEXP diviB ， 调 床 XP_quotient 会 返 网 r 的 最 低 有 效 位 ， 内 此 其 余 位 必须 显 式 设置 为 0 ; 





能 与 (8-1 b+(b-1)=b2-1=65 535 一 样 大 ， 存 成 一 个 无 符 


(single-digit division 311)= 
if Cy[0] == O) 
return 0; 
r[0] = XP_quotient(nx, q, x, y[0]); 
memset(r + 1, '\O', my - 1); 


在 MMOL, in mit Am> lit, — Ân {y eR Bed BK — fom fr 3k aHYR D11028 
HB, 615 36755296 3H BR ERE FPR ETR. 在 被 除数 的 首位 添加 0 ， 使 得 n 超 出 m。 
0 7 8 
29 6[ 0 6 3 6 7 
5 


0 


0 
0 


on 
c wln cimo 


lows 





2 


7 
8 
9 


N 
MONIO w 

NI ox w 

[e eins 


计算 竺 一 个 商 值 a. BAR Amfi, UA KO RI BR Het AE PS TE. 
BERERA Aa HARA. LE DUIS RK RE SEL, 
rem e x with a leading zero 
for (k  n- m; k >= 0; k--) { 
compute gk 
dq — y*qk 
q-»digits[k] = qk; 
reme- rem - dq. b* 
} 
rerem 
rem FRAY jx 838, AAO, B >t Him 28% EA rem Büme LS. B FC He HE , 
EK tir Toms KRHA. EIT AEA RAL, remitdiqk fly hR, XS tirem 
减少 一 位 。 如 上 面 的 例子 ，n=6，m=3， 循 环 体 执行 4 次 ，k=6-3=3，2，1 和 0 。 下 囊 列 出 了 
在 每 一 次 计算 中 k 、rem 、q9K 和 dd 的 值 。 第 二 列 的 划 线 部 分 确定 『rem 的 前 组 ， 这 里 rem 与 y 相 
踪 ，y 的 值 足 296 - 








311 











BITE 








228 — 
k rem qk dq 
3 2 0592 
2 e 0000 
1 了 2072 
0 8 2368 








XP. div is 3E ^ |a] EAR (£P Pt rem dq; rem iene ET. dg Ems EW, TERR 
AET YR, KARIR ARA PD: N 


(long division 312)= 
int k; 
unsigned char *rem = tmp, *dq = tmp + n + 1; 
assert(2 <= m && m <= n); 
memcpy(rem, x, n); 


rem[n] = 0; 

for (k = n - m; k >= 0; k--) í 
int ak; 
(compute qk, dg — y-qk 314) 
q[k] = qk; 


(rem — rem - dq- bk 315) 
} 
memcpy(r, rem, m); 
(fill out q and r with Os 313) 


tmpf0.n] 保 在 rem 的 n+1 位 数字 ，tmap[n+1..n+1+m] 保 在 了 dq 的 m+1 位 数字 。 在 tmpl0,k+m] 里 ， 
Tem 总 是 有 k+m+t1 位 数字 。 代码 计算 个 np-m+1 位 的 商 和 -个 m 位 的 余数 ，q fr 的 此 余数 
FOWO: 


(fill out q and r with Os 313)= 






int i; 

for G n-m4l; i < nx; i++) 
qali] = 0; 

for G = T < my; i++) 
r[i] 0; 





所 有 的 余数 ES SINR. AM RAS LS EORR Fk, eT A gk 
等 于 b -1 ， 并 逐渐 递减 dk ， 让 到 y' qki Hirem 的 m+1 位 前 级 ， 


qk = BASE-1; 

dq <- y: qk; 

while Crem[k.k+m] < dq) í 
qk--; 
dq < y- ak; 

} 
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此 方法 太 慢 :循环 可 能 需要 b-1 次 反复 计算 ， RIP E -次 m 位 乘法 和 -次 m+1 位 比 
较 。 一 个 更 好 的 方法 足利 用 常山 的 整数 运算 更 精确 由 合计 qk ， 当 估计 错误 时 就 纠 止 咏 。 王 位 





数 rem 前 级 与 两 位 数 y 前 级 相 除 可 以 估计 出 qk 是 正确 还 是 太 大 ， 因 此 ， 上 面 的 循环 可 用 单个 测 
试 来 代替 ; 
(compute gk, dq e y - qk 314)= 
int i; 
assert(2 <= m && m <= kim && kim <= n); 
(qk — y[m-2..m-1] /rem[k+m-2..k+m] 314) 
dqím] = XP_product(m, dq, y, qk); 
for (i = m; i > 0; i--) 
if Crem[i«k] != dq[il) 
break; 
if (rem[i+k] < dg[i}) 
dq[m] = XP_product(m, dq, y, --qk); 
} 


如 上 所 示 ，XP_product 计 算 y[0..m-1] xqgk， 把 结果 赋予 dd， 返回 最 后 的 进位 ， 也 就 是 dq 的 
最 后 位 值 。 循 环比 较 rem[k..k+m] 和 dq， -次 比较 一 位 。 妈 果 dq 超 出 rem 的 ms 位 前 组 ,那么 
9K 就 太 大 了 ， 央 此 qk 要 递减 ，dq 也 要 重新 计算 _ 

用 常用 的 整数 除 涉 能够 估计 qk : 





(qk — y[m-2..m-1]/rem[k+m-2..k+m] 314)= 
{ 


int km = k + m; 
unsigned long y2 = y[m-1]*BASE + y[m-2]; 
unsigned long r3 rem[km]*(BASE*BASE) + 
rem[km-1]*BASE + rem[km-2]; 
qk = r3/y2; 
if (qk >= BASE) 
qk = BASE - 1; 


1 

TS LEK RE 5$ (b-1)b° + (b-1)b + (b-1) = b3-1=16 777 215—Ë K. Gef fée 一 个 无 符号 长 整形 
数 中 。 计 算 限 制 TBASE 的 选取 . 一 个 无 符 叶 长 整形 能 够 存储 小 于 2 的 数值， 这 也 就 表明 
b-1-2?, BI IEBASE AL 32/995, ie RAE MEE 625 256 是 不 超过 1 6258928918 K RE, 
这 也 是 虚 人 类 型 的 尺寸 。 

关于 长 整形 除法 的 最 后 .点 迷惑 是 从 rem 的 m+1 位 前 缀 减 夫 dy , 这 会 减少 rem 并 将 其 缩短 
一 位 数字 。 从 理论 上 来 说， 通过 将 dq 左 移 K 位 数字 ， 然 后 肯 从 rem 中 减 去 该 值 ， 就 可 以 实现 减 
法 。 如 上 所 示 的 XP_sub 能 够 通过 把 指针 指向 rem 里 合适 的 数字 米 完 这 种 减法 : 


(rem « rem - dg. b" 315)= 


1 





int borrow; 
assert(O <= k & k <= k-m; 
borrow = XP_sub(m + 1, &rem[k], &rem[k], dq, 0); 
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assert(borrow == 0); 
} 
在 <compute qk, dq«-y -qk 374> 里 的 代码 指出 了 两 个 多 位 位 数 数字 通过 比较 它们 的 位 数 
来 完成 比较 ， 最 高 生效 位 优先 比较 。XP_cmp 通 过 两 个 XP_T 参 数 淮 确 完成 了 比较 ; 


(functions 304)+= 
int XP_cmp(int n, T x, T y) Í 
int i =n - 1; 
while (i > O && x[i] == y[i]) 
i--; 
return x[i] - y[i]; 
} 


17.2.4 Bir 


XP RA PS (ie PR ST A XP_TH EB) Behe. as fr TRE LLB Wb AT : 
第 一 步 足 通过 一 次 转移 一 个 宁 节 来 移动 8.(s/8 ) 个 位 , 第 Uh SNH Rs mod 8 位 ， 每 
次 移动 s mod 84%, HAA KIL 08 为 1 或 全 为 0 的 字 节 ， 能 够 被 用 于 -- 次 填充 一 个 字 节 ， 如 
下 所 示 : 


(functions 304)+= 

void XP Tshift(int n, T z, int m, T x, int s, int fill) { 
fill = fill ? OxFF : 0; 
(shift left by s/8 bytes 316) 
s %= 8; 
if (s > 0) 

(shift z left by s bits 317) 
} 


这 些 步骤 可 由 下 图 所 未 ， 下 图 显 水 了 将 一 个 含有 44 个 “1” 的 6 位 XP_T 左 移 13 位 转变 为 8 位 
XP_T 的 过 程 ， 右 边 的 浅 色 部 分 标识 空位 ， 关 设 帝 为 fill 值 - 
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139,8 位 




















左 移 s/8 字 节能 够 通过 以 下 分 配 实现 。 


z[m+(s/8).n-1] — 0 
z[s/8.m+(s/8)-1] © x[0.m-1] 
z[0..(s/8)-1] — fi11. 


FEX 231 





FR Ar eio Hee srt m W 682: Bë OREO. 在 第 二 次 分 配 中 , x EE PZ 
最 高 有 效 位 优先 第 三 次 分 号 将 z 的 88 最 低 有 效 位 设置 为 fl] 值 。 每 一 次 分 配水 及 一 个 循环 ， 
当 n 小 于 m 时 ， 初 始 化 代码 会 处 理 这 种 情况 ; 
(shift left by s/8 bytes 316)= 
{ 


int i, j=n- 1; 

if (n > m) 
i = m- 1; 

else 
i = n - s/8 - 1; 

for ( ; j >= m + s/8; j--) 
z[j] = 9; 

for ( ; i >= 0; i--, j--) 
z[j] = x[i] 

for C i j >= 
z[j] = fill; 






H 
在 第 二 步 时 ，s 减 至 移动 位 数 ， 移 位 位 数 等 价 于 z MOR. MUS SUBE OR RAT Des Fo fl, 
(shift z left by s bits 317)= 
{ 
XP_product(n, z, z, 1««s); 
z[0] |= fill>>(8-s); 
H 
名 1 或 者 为 0 或 者 为 0KFF， 内 此 fill>>(8 5) 在 -个 字 节 的 最 低 有 效 位 形成 了 s 个 十 充 位 。 
ARNE RRA ERED: 第 一 步 向 右 移 动 %8 字 他、 第 一 步 移 动 其 余 的 $ 
mod 8 位 ， 
(functions 304)+= 
void XP_rshiftCint n, T z, int m, T x, int s, int fill) { 
fill = fill? OxFF : 0; 
(shift right by 5/8 bytes 318) 
s %= 8; 
if (s > O) 
(shift z right by s bits 318) 
} 
把 有 44 个 “1” 的 6 位 数 XP_T 右 移 13 位 转变 为 -个 8 位 笋 XP_T， 下 图 说 明了 上 述 步骤 ; 左边 
的 浅 色 部 分 标识 空位 数 和 超出 位 ， 这 些 
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1398 位 
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石 移 的 二 次 分 配 是 


z[0.m-(s/8)-1] <— x[s/8.m-1] 
z[m-(s/8).m-1] — fill 
z[m.n-1] <— fill. 


第 一 次 分 配 把 xi 复制 到 zs。 从 s/8 字 节 片 始 . 最 低 有 效 字 节 优 先 。 第 一 次 分 配 设 置 空 字 节 为 
fil 值 ， 第 三 次 分 配 将 z 里 的 “ 些 不 会 出 现在 x 里 的 数字 设置 成 fl 值 。 当 然 ， 第 一 次 和 第 三 次 
分 配 可 以 在 加 一 个 循环 中 完成 : 





(shift right by s/8 bytes 318)= 
i 


int i, j = O; 


for G = 5/8; i < m && j < n; i++, je 
z[j] = x[i]; 

for ( ; j < n; j+) 
z[j] = fill; 


H 
第 二 步 把 z 右 移 s 位 ， 这 等 价 于 z 除 以 冯 ; 
(shift z right by s bits 318)= 
t 


XP_quotient(n, z, Z, l<<s); 
z[n-1] |= fill<<(8-s); 


表达 式 fill<<(8- s) fe FR AT CREUSE s Inge fy. HR, HE Ljz DU AS W 
进行 或 操作 。 


17.2.5 字符 串 转换 


最 后 的 防 个 XP 函 数 把 XP_T 转 换 成 字符 帅 ， 以 及 从 宁 符 中 转换 成 XP_T 。XP_fromstr 转 换 
字符 串 到 XP_T， 它 接受 -个 可 选 空 由 区域 以 及 1 位 或 多 位 数 的 底数 ， 范 围 是 从 2 到 包括 36 的 
整数 区 间 。 底 数 如 是 超出 10 ， 可 以 用 字符 表 坟 赵 出 9 的 数学 48 = OR a t ss Y 
符 时 ， 战 者 当 乘法 中 的 最 终 进 位 非 0 时 ，XP_fromstr 将 停止 打 撒 字符 串 参 数 。 


(functions 30445 
int XP. fromstr(int n, T z, const char *str, 
int base, char **end) { 
const char *p = str; 


assert(p); 
assert(base >= 2 && base <= 36); 
(skip white space 320) 
if ((*p is a digit in base 320)) { 
int carry; 
for ( ; (*p is a digit in base 320); p++) í 
carry = XP. product(n, z, z, base); 
if (carry) 


FR: JE A 233 





break; 
XP_sum(n, z, z, map[*p-'0']); 


H 
if (end) 

*end = (char *)p; 
return carry; 


) else { 
if (end) 
*end = (char *)str; 
return 0; 
H 


了 


(skip white space 320)= 
while (*p && isspace(*p)) 
p++; 


ka Rendje7s , XP_fromstr fi * end KH ACHE P EOG 2€ I FH EA RE , 
HURciE— MAREE, MBAmaple-O' VER RAT (8; 例如 ，map['F' -0 是 15 、 


(data 320)= 

static char map[j = { 
0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 
36, 36, 36, 36, 36, 36, 36, 
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 
23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 
36, 36, 36, 36, 36, 36, 
10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 
23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35 

n 


SEXPIEEOSE SI FASCINE 90 #|z2 n] | 3k ARE , map[c-*0' ] 4E F36. fniffmap[c- *0" ] 小 
base, IBA FE SRA, RTL Bic RS Elbase 为 底数 的 数字 -内 而 ，XP_fromstr 会 按 如 下 
语句 测试 足 否 *p 是 一 个 数字 字符 : 
(*p is a digit in base 320)= 
Cp && isalnum(*p) && map[*p-’0'] < base) 
XP_tostr 利 用 通用 的 算法 米 计 算 x 的 学 符 中 表示 ， 先 刊 去 数字 的 最 后 位 ， 
米 实现 ， 但 足 XP_tostr 使 用 了 XP 函 数 米 完成 算法 . 


(functions 304)+= 
char *XP_tostr(char *str, int size, int base, 
int n, Tx) { 
int i = O; 





assert(str); 

assert(base >= 2 && base <= 36); 

do í 
int r = XP_quotient(n, x, x, base); 
assert(i < size); 
str[i++] = 
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"0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZ" [r]; 
while (n > 1 && x[n-1] == 0) 
n--i 
} while (n > 1 || x[0] ! 0); 
assert(i « size); 
str[i] = '\0'; 
(reverse str 321) 
return str; 
} 


数字 以 str 逆 序 结束 ， 央 此 XP_tostr 终 止 操作 时 ， 将 它们 道 转 。 


(reverse str 32`)= 


t 
int j; 
for (j = O; j < --i; j+) í 
char c = str[j1; 
str[j] = str[il; 
str(i] = c; 
i 
了 
参考 书目 浅 析 


XP 中 的 大 多 数 算术 丙 数 直接 实现 了 我 们 每 个 人 在 小 学 就 已 经 学 过 的 运算 法 则 。 
Hennessy 和 Patterson (1994 ) 的 第 4 章 以 及 Knuth (1981) 的 4.3 节 表述 了 实现 算术 操作 的 经 
MAE, Koth (1981) 对 那些 算法 的 长 期 发 展 历史 给 予 了 精彩 的 总 结 。 

除法 的 实现 是 困难 的 ， 这 是 因为 强加 在 计算 上 的 商 值 限制 。 用 在 XP_div 中 的 算法 来 白 
Brinch Hansen (1994 )， 其 中 有 所 估计 的 商 俏 最 大 偏离 为 1 的 证 明 。Brinch Hansen 指 出 了 如 
何 通 过 缩放 操作 数 的 比例 来 避免 在 大 部 分 时 间 内 纠 jHqk。 旨 放 要 花 半 一 个 附加 的 个 忆 数 乘法 
和 除法 . 但 在 必须 消减 qk 的 情况 下 . 下 以 避免 一 次 调用 product , 


练习 


17.1 用 XP_div 采 用 的 Brinch-Hansen 算 法 来 实现 递归 除法 算法 、 并 比较 它 的 执行 时 间 和 和 
空间 性 能 。 递 归 算 法 在 什么 条 件 下 更 优越 ? 
17.2 实现 Hennessy 和 Patterson ( 1994 ) 的 第 4 章 描 述 的 “ 移 位 并 相 减 ”除法 算法 ， 并 对 
它 和 用 在 XP_div 蜂 的 Brineh-Hansen 算 法 进行 作 能 比较 。 
17.3 大 部 分 XP 函数 花 党 的 计算 时 间 与 操作 数 中 的 数字 个 数 成 比例 。 以 底数 为 246 来 表示 
XP_T ,将 会 使 少数 的 运行 速度 快 _ 信 。 然 而 ， 对 于 有 除法 却 产 牛 了 .个 问题 ， 内 为 
(25-1 = 28 147 497 610 655 





超出 了 大 多 数 32 们 计算 机 的 ULONG_MAX 值 ， 并 月 标准 C 的 整数 算法 不 能 用 来 估 
计 此 方式 下 的 商 值 。 针 对 这 个 问题 设计 一 个 方法 ， 用 底数 216 米 实现 XP， 并 权衡 和 
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17.44 用 底数 232 完 成 练习 17.3 - 

17.5 MEREZA. W. 那么 扩展 精度 算法 可 以 用 汇编 语言 实现 ， 因 为 许多 机 器 有 
冯 精 度 指令 ， 并 日 能 够 容易 地 捕获 进位 和 借 位 。 汇 编 语言 实现 起 来 速度 很 天 。 在 
自己 钟爱 的 计算 机 上 用 汇编 语言 实现 XP ， 并 人 确定 速度 提高 的 程度 ， 

17.6 实现 一 个 产生 随机 数 的 XP 函数 ， 随 机 数 要 求 岁 勾 地 分 布 存 指定 范围 内 。 
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木 训 介绍 了 AP 接 门 ， 这 个 接口 提供 任意 精度 的 有 符号 整数 太 上 相 关 算 法 操作 。 与 XP_T 
不 同 ，AP 提 供 的 整数 可 以 为 正 或 为 负 . 而 且 它 们 可 以 是 任意 售 的 数字 它 全 所 能 够 表示 的 
数值 仪 受 可 用 存储 器 的 限制 这些 整 数 可 用 十 寡 要 无 限 范围 整数 值 的 应 用 程序 、 例如， 一 些 
共同 基金 公司 跟 踩 股票 价格 非常 接近 十 百 分 之 一 美 分 一 1 关 元 的 1110 000 一 一 这 样 ， 所 有 
的 计算 可 能 帮 以 百 分 之 “ 美 分 为 单位 进行 - 32 位 的 无 符号 竖 数 仪 可 表 泵 429.496.7295 美 元 ， 
而 这 仅仅 是 一 些 基 金 所 持 有 的 数 和 亿美 元 中 披 微小 的 一 部 分 ， 

当然 ，AP 使 用 了 XP， 介 中 AP 足 个 尚 级 接 H ; CRER T — aea dt dd ien dro Ee 
数 的 降 式 类 型 、AP 会 导出 丽 数 以 分 配 和 释放 这 些 整数 ， 并 在 这 些 整 数 上 执行 常用 算法 操作 。 
它 还 实现 了 XP 钨 略 的 可 检查 的 运行 期 锣 误 、 大 多 数 应 用 程序 部 应 使 用 AP 或 下 - 章 所 介绍 的 
MPO. 











18.1 #0 
AP ELLE TT ROBE TES ERREUR BRET BRACE EPS AU (ii; 


(ap. hz 
#ifndef AP INCLUDED 
#define AP INCLUDED 
#include «stdarg.h» 


#define T AP T 
typedef struct T *T; 


(exported functions 324) 

#undef T 

#endif 
ARTE MLE BUG EAP TAE STNG EAI MAR, FAR ERP 
PU ex C OT AE AP T: 
(exported functions 324)= 

extern T AP. new (long int n); 


extern T AP fromstr(const char *str, int base, 
char **end); 


AP_new/t aR A BAP T. JEJE RIAL Hiin, SRIGOR El. AP fromstri E k -个 
WAP. T, Hirisi abase fE MIME Py KGW Mf. JG I|, AP_new#IAP_fromstray bL ul 4 
Mem Failed , 


Ë 
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AP_fromstr 就 像 C 库 函数 中 的 strtol， 它 把 str 里 的 字符 出 按 base 解 释 成 一个 整数 。 CBM 
前 导 空 格 ， 并 接受 - .个 可 选 符号 ， 其 后 跟随 着 一 位 或 多 位 以 base 为 底数 的 数字 。 对 于 11 和 36 
之 间 的 底数 ，AP_fromstr 用 小 写字 尽 或 大 写字 母 解释 大 于 9 的 数字 。base 小 于 2 或 大 于 36 则 会 
产生 一 个 可 检查 的 运行 期 错误 。 

如 果 end 非 空 ，*end 被 赋值 为 -个 指针 指向 终止 AP_fromstr 解 释 的 那个 字符 。 如 果 str 中 
的 字符 没有 一 个 以 base 为 底数 的 整数 ，AP_fromstr 就 返回 空 ， 而 片 ， 如 果 end 不 为 空 ， 就 把 
rend 设置 为 str ，st 为 空 则 会 产生 一 个 吕 检 杰 的 运行 期 错误 ， 

函数 


(exported functions 32445 
extern long int AP toint(T x); 


extern char *AP tostr(char *str, int size, 
int base, T x}; 
extern void AP fmt(int code, va list “app, 


int put(int c, void *c1), void *cl, 
unsigned char flags[], int width, int precision); 


提取 并 打印 AP_T 所 表示 的 整数 。AP_toint 返 回 一 个 符号 与 x 相 问 、 数 值 等 Ixl mod 
(LONG_MAX+1) HK GB, P ELONG MAX BAK WIE KE, Rx 
LONG_MIN 一 一 在 二 进 制 补 码 机 器 上 是 -LONG_MAX-1 一 一 AP_toint 就 返回 (LONG_MAX+1) 
mod (LONG MAX«1), BIO. 

AP_tostr HIE ik TR BFE sts, LEP ERE RE base X UK Mx SERE dos EE. 并 返回 
str。 大 写字 母 用 丁 表示 base 超 出 10 时 那些 大 了 9 的 数字 ,. base 小 于 2 或 大 于 36 则 会 产生 一 个 可 
检查 的 运行 期 错误 。 

如 果 str 非 空 ，AP_tostr 将 给 str 填 完 size 数 量 的 字符 。size Ki MLSs HE BJ rs fn (HUI 
误 一 一 更 移 切 地 说 ,x 的 宇 符 表 示 加 上 一 个 卒 字符 需要 多 丁 size 的 字符 -如果 str 为 就 忽略 
size; AP_tostt 将 分 配 足 够 大 的 字符 申 窑 纳 x 字 符 表 示 ， 并 返 器 孝 个 字符 中。 客 广 泣 用 程序 有 
责任 释 放 分 配 的 字符 串 。 如 果 str 为 害 ，AP_tostr 会 引发 Mem_Failed 。 

AP_fmt 中 与 Pmt 接口 中 的 咀 数 一 起 用 作 转换 妆 数 来 格式 化 AP_T。 它 用 掉 -个 AP_T ， 并 根 
据 可 选 的 flags 、width 和 prccision ， 按 照 与 printf 的 限定 答 %d 格 式 化 其 整 数 参数 相同 的 方式 进行 
格式 化 。AP_fmt 可 以 引发 Mem_Failed 。app 或 flags 为 空 则 会 产生 一 个 可 俭 镶 的 运行 期 错误 。 

AP_T HH 





(exported functions 324)-= 
extern void AP_free(T *z); 


释放 。 
AP_free 释 放 *z 的 内 容 并 将 其 设 问 为 空 - z 上 或 *z 为 空 则 会 产生 一 个 可 检查 的 运行 期 错误 。 
下 列 函 数 在 AP_T 上 执行 算法 操作 ”等 个 函数 都 返回 :个 AP_T 作 为 结果 ， 而 日 个 个 都 可 
以 引发 Mem_Failed 。 
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(exported functions 324)+= 
extern T AP_neg(T x); 
extern T AP_add(T x, T 
extern T AP_sub(T x, T 
extern T AP mul(T x, T 
extern T AP div(T x, T 
extern T AP mod(T x, T 
extern T AP pow(T x, T 


AP_neg 返 回 -x; AP_addi& fix «y; AP_subi& Elx -y; AP_mul 返 四 x -y; AP. divi [9] 
Xy; AP_mod 返 同 x mod y ,这 里 ，x 和 y 指 的 是 x 和 y 所 表示 的 整数 值 。 除 法 向 左 取 齐 ;x 或 y 
有 一 个 为 负 则 趋向 于 黄 无 穷 ， 冯 之 则 趋向 于 0。 因 此 ， 余 数 总 为 止 。 更 为 精确 的 是 ， 商 gq 足 不 
超出 实数 w 的 最 大 整数 、w，y =x， 余 数 定义 为 x-y q- 这 个 定义 与 第 2 帝 中 介绍 的 Arith 接 
口 所 实现 的 定义 一 致 。 对 于 AP_div 和 AP_mod ， 如 果 y 为 0 则 为 可 检查 的 运行 期 错误 。 

如 果 p 为 空 AP_pow 返 同 xy; AARpIEs . ，AP_pow 则 返回 《xy ) mod p. 如 果 y 为 负数 ， 或 
了 非 空 且 小 于 2， 则 为 “个 可 检 窒 的 运行 期 错误 。 

T vit 





(exported functions 324)+= 
extern T AP_addi(T x, long int y); 
extern T APLsubi(T x, long int y); 
extern T AP_muli(T x, long int y); 
extern T AP.divi(T x, long int y); 
extern long AP modi(T x, long int y); 
与 上 述 两 数 类 似 ， 只 是 y 取 长 整 型 。 举 个 例子 ，AP_addi (x, y) 4 TAP add (x, 
AP_new Cy ) )， 关 十 除法 和 皮 余 的 规则 与 AP_div 和 AP_mod 相 同 这 些 函数 中 每 个 者 可 以 引 
发 Mem_Failed 。 
可 用 下 列 函 数 移 位 AP_T : 
(exported functions 3244 
extern T AP. Ishift(T x, int s); 
extern T AP rshift(T x, int s); 
AP-IshifGE E] -个 AP_T， 其 值 等 于 x 左 移 s 位 后 的 值 ， 就 等 价 于 x 乘 以 2。AP_rshift 则 返回 一 
个 值 相 当 了 于 Xx 右 移 s 售 的 AP_T， 等 价 于 x 除 以 2 。 这 两 个 哺 数 返回 值 的 符号 都 与 x 相向 ， 除 非 
进行 移 们 的 值 是 0， 同 时 空 出 的 位 都 设置 成 0 。 s 为 负 则 为 一 个 可 检 桔 的 运行 期 错误 ; K 
数 还 可 以 引发 Mem_Failed | 
AP_T 可 通过 如 下 函数 进行 比较 
(exported functions 3244— 


extern int AP cmp (T x, T y); 
extern int AP.cmpi(T x, Jong int y); 


x<y 、x=y 或 x>y 时 ， 这 两 个 函数 分 别 返 回 小 于 0 .等 于 0 或 大 二 0 的 整数 。 
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18.2 示例 : 一 个 计算 器 


这 里 用 一 个 执行 任意 精度 计算 的 计算 器 说 明 AP 接 口 的 使 用 ; 下 一 节 介 绍 的 AP 接 口 实现 
则 站 述 了 XP 接口 的 使 用 。 

iE SEREcalcfü HUE o SEE. 值 推 人 堆栈 顶端 ; 运算 符 从 栈 沾 弹 出 它们 的 操作 数 并 将 
AREA. 秆 就 是 一 个 战 多 个 相 邻 十进制 数 ; 运算 符 旭 如下 : 

- HUE 

+ 加 法 

- 减法 

+ 乘法 

£ 除法 

96 WR 

x ORK 

d 复制 栈 顶 位 

p HH 

TOME MR FID Beh f 

9 退出 

空格 字符 用 于 分 了 关 数 值 但 木 入 会 被 忽略 不 记 ; 其 他 空 符 帮 占 时 为 未 被 襄 草 的 运算 符 ， 堆 
栈 的 大 小 仅 受 限于 可 几 在 储 器 .位 是 诊断 程序 会 上 声明 叭 栈 下 洲 

calc 是 个 简单 的 程序 。 它 有 =: 项 主要 的 上 作 : 解释 给 入、 计算 入 及 管理 礁 懂 ， 





(cale.Q= 
#include <ctype.h> 
#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 
finclude "stack.h" 
#include "ap.h" 
#include "fmt.h" 


(calc data 328) 
(calc functions 328) 


i Rüstack.h TE GAIAN JOB ARRE, cale 0 HE Ff cH SORES HB AHR Eli, 


(calc data 328)= 
Stack T sp; 


(initialization s28)s 
sp = Stack newO; 


Sp 2 teal HERRE Stack pop, [Xf HE Br 03811 Ee ide — 4 eoe MAR F i M 
函数 里 : 
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(calc functions 328)= 
AP_T pop(void) { 
if (!Stack_empty(sp)) 
return Stack_pop(sp); 
else { 
Fmt_fprint(stderr, "?stack underflow\n"); 
return AP. new(0); 





BDH MERE I Tr CUBO RAP T. DU 
calc p i EAR LICE ° 


fcale (| JL fibi Jr UR E 
Ek RAM 然后 根据 谈 取 内 容 执 行 相 应 操作 ， 








Ms" 


(calc functions 328) 
int main(int argc, char *argv[]) í 
int c; 


(intialization 328) 
while ((c = getcharO) != EOF) 


switch (c) { 
(cases 329) 
default: 
if CGisprint(c)) 
Fmt_fprint(stderr, "?'%c'", c); 
else 
Fmt fprint(stderr, "?'NXX030'", c); 
Fmt fprint(stderr, " `s unimplemented\n"); 
break; 
} 


(clean up and exit 329) 


) 


(clean up and exit 329)= 
(clear the stack 333) 
Stack free(&sp); 
return EXIT SUCCESS; 


RASTA ELA e. LAT br. 3m R LL GRR AEL T BS s 4612 58 


Ao 空格 就 被 忽略 : 





(cases 329)5 
case ' ': case 'Nt': case ‘\n': case ‘\f’: case "Nr: 
break; 
数值 以 数字 开头 : calc 把 跟随 在 第 TUE COMER A 一个 缓冲 区 ， 并 用 
AP_fromstr 将 这 再 数字 转换 成 - -个 AP_T; 
(cases 329H= 
case '0': case '1': case 
Case '5': case '6': case 
Char buf[512]; 
(gather up digits into buf 333) 


: case '3': case '4': 
: case '8': case '9': í 





328 








329 
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Stack push(sp, AP fromstr(buf, 10, NULL); 


break; 
1 
SPIER AMET ANOS eT EHE, FOP £ Sh E ME A EE, IAEN RA 
代表 性 : 


(cases 329)+= 
case '+': í 
(pop x and y off the stack 330) 
Stack push(sp, AP_add(x, y)); 
(free x and y 330) 
break; 


1 


(pop x and y off the stack 330)= 
AP.T y = pop(), x = popO; 


(free x and y 330)= 
AP. free(&x) ; 
AP. free(&y) ; 


很 容易 产生 这 样 的 错误 : LEUR LR APTA AG RS} BIDS É PEAR BT AE BIB we 4 
FE BOMB PAP_T NEMRE hors r 3k SH A — f P URL. MERE OO A AI 
“永久 ”的 AP_T;， 词 用 AP_free 释 放 其 他 所 有 的 AP_T。 

减法 和 乘法 在 形式 上 都 与 加 法 类 似 ; 


(cases 329)+= 

case '-': í 
(pop x and y off the stack 330) 
Stack push(sp, AP sub(x, y)); 
(free x and y 330) 
break; 

} 

case '*': { 
(pop x and y off the stack 330) 
Stack_push(sp, AP_mul(x, y)); 

330 (free x and y 330) 

break; 


1 
除法 和 肥 余 也 很 简单 ， 但 足 它们 必须 防止 除数 为 0。 


(cases 329)4+= 
case '/': { 

(pop x and y off the stack 330) 

if (AP _cmpi(y, 0) == 0) í 
Fmt_fprint(stderr, "?/ by ONn"); 
Stack_push(sp, AP_new(0)); 

} else 
Stack_push(sp, AP_div(x, y)); 
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(free x and y 330) 
break; 
} 
case '%': í 
(pop x and y off the stack 330) 
if CAP cmpi(y, 0) == 0) { 
Fmt fprint(stderr, "?%% by O\n"); 
Stack push(sp, AP.new(0)); 
} else 
Stack push(sp, AP.mod(x, y)); 
(free x and y 330) 
break; 


} 
REG B EAE Be TEER: 


(cases 329) 
case '^': ( 
(pop x and y off the stack 330) 
if CAP. cmpi(y, 0) <= O) { 
Fmt fprint(stderr, "?nonpositive power\n"); 
Stack push(sp, AP_new(0)); 
} else 
Stack push(sp, AP pow(x, y, NULL); 
(free x and y 330) 
break; 


H 


将 栈 质 的 数值 弹出 堆栈 可 以 复制 该 倩 ， 这 样 就 会 检测 到 堆栈 下 溢 ， 并 将 该 信 及 其 副本 扒 


APER ENAP THRE 途径 就 是 让 它 加 0 


(cases 329)+= 
case 'd': { 
AP-T x = popO; 
Stack.push(sp, x); 
Stack push(sp, AP addi(x, 0)); 
break; 
H 


TRAP ovt S X -格式 代码 相关 联 ， 并 在 传递 给 Fmt_fmt 的 格式 字符 帅 中 使 用 姥 个 代码 ， 


就 可 以 打印 AP_T; calc 使 用 D . 


(initialization 328)+= 
Fmt register('D', AP fmt); 


(cases 329)» 
case 'p': í 
AP-T x = popO: 
Fmt print("XDNn", x); 
Stack push(sp, x); 
break; 
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TT EN MEER AY Br Ar RUH FE HH Stack HE O TAY — rS: 不 能 访问 栈 项 元 案 下 面 的 数值 、 
也 上 就 不 能 断定 堆栈 中 有 多 少数 什 。 更 好 的 堆栈 接口 可 以 包含 Table_length 利 Table_map 这 样 
KAR: 没有 这 些 两 数 ，calc 就 必须 创建 -个 临时 堆栈 把 主 堆 楼 的 所 有 内 容 全 部 倒 入 临时 纵 
栈 中 ， 同 时 按 顺 序 打 印 数值 ， 然 后 再 从 临时 堆栈 中 把 所 有 数值 倒 回 主 栈 。 


(cases 329)+= 
case 'f': 
if (IStack empty(sp)) í 
Stack.T tmp = Stack_new(); 
[332] while (!Stack empty(sp)) { 
AP_T x = popO ; 
Fmt print("XDNn", x); 
Stack push(tmp, x); 





H 
while (!Stack empty(tmp)) 
Stack push(sp, Stack pop(tmp)); 
Stack free(&tmp); 
} 


break; 


剩 下 的 就 是 数值 肥 反 、 





“堆栈 并 进出 ， 


(cases 329)+= 
case '~': í 
APT x = pop(); 
Stack_push(sp, AP_neg(x)); 
AP_free(&x); 
break; 
H 
Case 'c': (clear the stack 333) break; 
case 'q': (clean up and exit 329) 
(clear the stack 333) 
while (!Stack empty(sp)) { 
AP. T x = Stack pop(sp); 
AP free(&x) ; 
H 


calc 清 除 堆栈 的 时 候 会 释放 堆 王 的 那些 AP_T 以 避免 生成 不 能 达到 肯 未 远 无 法 释放 所 占 内 
MMA. 
calc 的 最 后 部 分 代码 将 一 串 一 个 或 多 个 数字 读 入 buf ; 


(gather up digits into buf 333)= 


int i = O; 
for ( ; c != EOF && isdigit(O; c = getchar(), i++) 
if Gi < Gint)sizeof (buf) - 1) 
buf[i] = c; 
if Ci > Cint)sizeof (buf) - 1) í 
B33} 3 = Cint)sizeof (buf) - 1; 
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Fmt fprint(stderr, 
""integer constant exceeds Xd digits\n", i); 
H 
buf[i] = 0; 
if (c != EOF) 
ungetc(c, stdin); 
+ 


小 如 这 段 代码 所 示 、calc 声 明 数 字 过 长 截断 了 它们 。 
183 ”实现 


AP 接 口 的 实现 阐述 了 XP 接口 有 代表 性 的 使 省 。AP 使 用 带 符号 数值 表示 有 符号 数 : 


AP_T 指 向 含有 这 个 数 的 符号 以 及 其 绝对 值 的 结构 XP_T。 


(ap.Q= 
#include <ctype.h> 
#include <limits.h> 
#include <stdlib.h> 
#include <string.h> 
#include "assert.h" 
#include "ap.h" 
#include "fmt.h" 
#include "xp.h" 
#include "mem.h" 


#define T AP_T 


struct T { 
int sign; 
int ndigits; 
int size; 
XP T digits; 
B 


(macros 337) 
(prototypes 336) 
(static functions 335) 
(functions 335) 























sign 1 
ndigits 5 
Size 11 
digits — 
4 245102, 33 | 
175 
Loi 








图 18-1 Little endian [一 个 等 于 751,702,468,129 的 AP_T 的 小 尾数 法 布局 
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sign 2y1 22-1. size 是 分 瑟 给 digits 所 指 空间 的 位 数 ， 它 可 以 大 于 使 用 中 的 位 数 ndigits ; W, 
— TAP_T Hidigits[0..ndigits-1] Æ ®XP_T4 EAM. AP T EBON: 它们 最 高 有 
效 数 字 位 非 零 ， 除 非 这 个 数值 就 足 零 、 因 而 ，ndigits 经 党 小 于 size。 疼 18-1 显示 了 一 台 小 必 


数 法 计算 机 上 具有 32 位 单间 和 8 位 字符 的 一 个 等 1751 702 468 129 的 11 位 数 AP_T， 隐 藏 了 
digits 数 组 中 的 未 使 用 元 素 : 
AP_T 由 如 下 两 数 进行 分 配 


(functions 335)= 
T AP. new(long int n) í 
return set(mk(sizeof (long int)), n); 
} 


Ë 838 AFA HBAS Amk ERRA: mk 会 分 本 一 个 能 够 容纳 size 大 小 数字 的 AP_T ， 并 


(static functions 335)= 
static T mk(int size) { 

T z = CALLOC(1, sizeof (*z) + size); 
assert(size > 0); 
z->sign = 1; 
z-»size = size; 
z-»ndigits = 1; 
z-»digits = (XP D(z + 1); 
return z; 


Y 


在 带 符号 表示 法 中 ， 零 有 两 种 表示 方法 ; 通常 ，AP 有 只 使 用 目 数 表示 法 ， 就 像 mk 中 代码 
ERES 


AP new ill HS SA Se BAP TE MEOS AKS MART. (H. 通常，set 把 最 人 的 
那个 负 长 整 型 作为 -种 特例 : 


(static functions 335)+= 
static T set(T z, long int n) í 
if (n == LONG MIN) 
XP. fromint(z-»size, z->digits, LONG MAX + 1UL): 
else if (n < 0) 
XP_fromint(z->size, z-»digits, -n); 
else 
XP fromint(z-»size, z->digits, n); 
z->sign = n < 0 ? -1 : 1; 
return normalize(z, z->size); 


1 


z-psign RUN RcIGR E. RIK MP SAER- BES et. XP TE 
没有 规格 化 的 ， 因 为 它 最 高 有 效 效 字 位 可 以 是 8. SAP RPA -个 可 能 没有 规格 化 的 
XP_T 的 时 候 ， 它 调用 normalize 计 算 正 确 的 ndigits 字 段 以 进行 调整 ; 
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(static functions 335)+= 
static T normalize(T z, int n) { 
z-»ndigits = XP_length(n, z-»digits); 
return z; 


} 


(prototypes 336)= 
static T normalize(T z, int n); 
SLT WE BOT EAP T: 


(functions 335}4+= 
void AP_free(T *z) { 
assert(z && *z); 
FREE(*z); 


AP-_aew 昆 可 以 分 配 AP_T 的 惟一 途径 ， 内 此 ， 对 本 AP_free ， 从 安全 方面 而 言 . 应 “了 
解 ” 这 个 结构 和 数字 数组 所 上 的 空间 是 由 单个 分 配方 案 米 分 配 的 、 


18.9.1 取 反 和 乘法 


取 反 是 需要 实现 的 算法 操作 中 最 简单 的 ， 它 说 明了 带 符号 数值 表示 的 循环 问题 ; 
(functions 335)}4= 


T AP. neg(T x) { 
Tzi 


assert(x); 

z = mk(x->ndigits); 

memcpy (z->digits, x-»digits, x-»ndigits); 
z-»ndigits - x-»ndigits; 

z->sign = iszero(z) 71: -x-»sign; 
return z; 


H 
(macros 337)= 
#define iszero(x) ((x)->ndigits==1 && (x)->digits[0]==0) 
PR 了 值 为 0，x 取 反 都 只 足 拷贝 数值 卫 栈 转 符 全。 宏 iszero 利用 了 AP_T 是 规格 化 的 这 一 约束 : 
零 值 只 有 一 位 ， 
X c y 的 值 吓 Ix!， lyl， 而 且 它 可 能 具有 有 与 x 和 y 中 数字 总 数 阿 样 多 的 数字 ,x 和 y 符 号 相同 或 
者 x 或 y 其 一 为 零 时 结果 为 正 ， 上 反之 旭 为 负 . AFE- 因此 x 和 和 y 符 全 相同 时 比较 
(x and y have the same sign 338)= 
(Ox-»sign^y-»sign) == 0) 
为 真 ， 皮 之 为 假 ，AP_mul 泣 用 XP_mal 计算 Jxl lytA 002 S 


(functions 335)+= 
T AP_mu](T x, T y) { 
T z; 
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assert(x) ; 

assert(y); 

z = mk(x-»ndigits + y-»ndigits); N 

XP_mul(2->digits, x->ndigits, x-»digits, y->ndigits, 
y->digits); 

normalize(z, z->size); 

z->sign = iszero(z) 
i| tx and y have the same sign 338) ? 1 : -1; 

return z; 


} 
再 次 调用 XP_mul 计 算 z=z+x - y， 市 且 mk 将 z 初 始 化 成 一 个 规格 化 的 零 和 一 个 未 格式 化 的 零 。 
18.3.2 ”加 法 和 减法 


加 法 更 复杂 一 些 ， 因 为 根据 x 与 y 的 符号 和 值 ， 加 法 可 能 还 需要 减法 。 下 表 归 纳 了 加 法 的 
各 种 情况 。 


y<0 y20 











338 








x<0 — (Ixlelyl) yx ”如 果 y 之 Ix! 
(ixi-y) 如 果 y<fxl 
x20 x-lyl 如 果 x>lyl x+y 

- (lyl=x) 如 果 x «lyl 








如 果 x 和 y 非 负 ，IxI+IyI 就 等 于 x+y ， 因 此， 位 于 对 角 线 上 的 情况 都 可 以 通过 计算 lxl+ly1， 
并 将 符号 设 成 x 的 符号 即 可 解决 。 结 果 的 位 数 可 能 比 x 和 y 中 最 长 的 那个 数 的 位 数 多 1。 


(functions 335}= 
T AP.add(T x, T y) í 
T z; 


assert(x); 

assert(y); 

if (x and y have the same sign 3385) { 
z = add(mk(maxdigits(x,y) + D, x, y); 
z-»sign = iszero(z) ? 1 : x-»sign; 

} else 


(set z to x+y when x and y have different signs 340) 
return z; 


} 
(macros 337)+= 
#define maxdigits(x, y) (Cx)->ndigits > (y)-»ndigits ? X 
OO-»ndigits : (y)-»ndigits) 


add 调 用 XP_add 执 行 实际 的 如 法 : 
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(static functions 335)+= 
static T add(T z, Tx, T y) í 
int n = y->ndigits; 


if (x->ndigits < n) 
return add(z, y, x); 
else if (x->ndigits > n) £ 
int carry = XP_add(n, z->digits, x->digits, 
y->digits, 0); 
z->digits[z->size-1] = XP_sum(x->ndigits - n, 
&z-»digits[n], &x->digits[n], carry); 
} else 
z-»digits[n] = XP add(n, z->digits, x->digits, 
y->digits, 0); 
return normalize(z, z->size); 





H 
add rig 8 — AE BEM SUA R ABCA PE, REX Eby IC, XP, addi faz digits[0..n 1] 
中 的 n 位 总 和 并 返回 carry . carry Ljx—>digits[n..x—>ndigits -1] 的 和 成 为 2->digits[n.,z->size 1], 
如 果 x 与 y 售 数 相同 ，XP_add 就 像 前 面 缘 样 计算 np 位 数 总 和 ， 而 由 ，carry 就 是 z 好 高 有 效 位 。 
加 法 的 另 一 种 情况 也 可 以 简化 。x<0 、y BO Hixb-lylit ，x+y 的 值 就 是 Ixl-Iyl。 符 号 为 负 。 
x20, y<O FLxl>lyl 时 ，x+y 的 值 也 是 Ixl-4y1， 但 是 符号 为 目 ， 这 两 种 情况 结果 的 符号 都 与 x 的 
符号 相同 。 下 面 介绍 的 sub 执 行 的 是 减法 :cmp 则 比较 x1 和 Iyl。 其 结果 可 能 与 x 的 位 数 相同 。 


(set z to x+y when x and y have different signs 340)= 
if Ccmp(x, y) > O) { 
Z = sub(mk(x-»ndigits), x, y); 
z-»sign = iszero(z) ? 1 : x-»sign; 
} 
x«0, y20 Gixl<lylay , x+y 的 值 就 是 lyl-Ixl ， 符 号 为 正 ; x20, y«0 Blx! «lylif, xy ffi ab 
Alyl-hi, (URS ORTA, 两 种 情况 下 ， 结 果 的 符号 都 与 x 的 符号 相反 ， 而 县 结果 可 能 与 y 的 位 
数 相 同 。 


(set z to x+y when x and y have different signs 340)+= 





else { 
2 = sub(mk(y-»ndigits), y, x): 
z->sign = iszero(z) ? 1: -x-»sign; 
} 
减法 可 以 从 类 似 的 分 析 中 效益 。 下 表 列 出 了 各 种 情况 
y<0 y=0 
x<0 -(xl yl) 如 果 Ixl > ly! -(Ixlry) 


lyl-Ixl.-— 如果 Exi <ly! 





x20 x+lyl x-y 如果 x>y 
~(y-x) WFX «y 
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RE, IAR FRU RSLEC ee Sh, PA AT R ATIR x [Y AS R UTE S GET f 
符号 得 到 续 果 . 


(functions 335)+= 
T AP_sub(T x, T y) í 
T z; 


assert(x); 
assert {y); 
if (IG and y have the same sign 338)) { 
z = add(mk(maxdigits(x.y) + 1), x, y); 
z->sign = iszero(z) ? 1 : x->sign; 
} else 
(set z to x-y when x and y have the same sign 341) 
return z; 


} 
对 角 线 上 的 情况 取决 于 5 和 y 的 相对 值 、lxl>lyl 时 , x-y RAI yl, APSA, 如 果 
区 I 生 9 ， 那 么 x-y 的 值 就 是 yl-Ixl， 符 号 与 x 相 反 : 
(set z to x-y when x and y have the same sign 341)= 
if (cmp(x, y) > 0) í 


z = sub(mk(x-»ndigits), x, y); 
z-»sign = iszero(z) ? 1 : x->sign; 


} else { 
z = sub(mk(y-»ndigits), y, x); 
z->sign = iszero(z) ? 1 : -x->sign; 
3 


与 add 一 样 ，sub 调 用 XP 函数 实现 减法 ; y 永 不 大 于 x。 


(static functions 335)+= 
static T sub(T z, Tx, T y) í 
int borrow, n = y->ndigits; 


borrow = XP_sub(n, z->digits, x->digits, 
y->digits, 0); 
if (x->ndigits > n) 


borrow = XP_diff(x->ndigits - n, &z->digits[n], 
&x->digits[n], borrow); 
assert(borrow == 0); 
return normalize(z, z->size); 
} . 

如 果 x 长 于 y. 调用 XP_sub 计 算 z->digits[0..n-1] 并 返回 borrow. XX M borrowllx —digits[n..x > 
ndigits -1] 2 la] H) 25 3f iz—digits[n..x—»ndigits-1], RJA ñJborrow 20, 因为 所 有 sub 的 调用 中 
bel 过 yl 。 如 果 x 和 y 的 位 数 相同 ，XP_sub 就 像 前 面 慎 样 计算 这 n 位 数 的 差 ， 但 是 没有 borrow 传 递 


18.3.3 除法 


除法 与 乘法 “ 样 ， 只 是 内 截 反 规则 而 变 得 复杂 dns Ry EA, FE hey! H. 
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为 正 ， 余 数 为 x| mod yl; Wx Ay AS HM. MBAR. RARI mod lyl AS, MAR 
Ixllyl， 如 果 |x| mod 1yl 非 堆 ， 则 商 取 第 IxMlyl+1， 如 果 值 为 零 ， eux! mod lyl; ipx 
mod lyl 非 零 ， 则 余数 为 lyi-(Ixl mod ly) - 余数 总 为 目 。 商 和 余数 分 别 与 x 利 y 的 笠 数 相同 : 





(functions 335yH= 
T AP_div(T x, T y) í 
Tq. r; 


(q — X'y, r ex mod y 343) 
if (Kx and y have the same sign 338) && liszero(r)) { 
int carry - XP. sum(q-»size, q-»digits, 
q-»digits, 1); 
assert(carry == 0); 
normalize(q, q-»size); 
了 
AP_free(&r) ; 
return q; 
} 
(q — xly, r — x mod y 343)= 
assert(x); 
assert(y); 
assert(!iszero(y)); 
q = mk(x->ndigits); 
r= mk(y->ndigits); 


{ 
XP.T tmp = ALLOC(x-»ndigits + y->ndigits + 2); 
XP_div(x->ndigits, q->digits, x-»digits, 
y-»ndigits, y->digits, r->digits, tmp); 
FREECtmp) ; 
H 


normalize(q, q-»size); 
normalize(r, r-»size); 
q->sign = iszero(q) 
|| (x and y have the same sign 338) ? 1 : -1; 


x ly 的 符号 不 同时 ，AP_div 不 影响 余 故 调整， 央 为 它 合 亦 了 余数 、AP_mod 则 刚好 相反 : 它 
QU ege e E 


(functions 3354 
T AP_mod(T x, T y) í 
Tq, r; 


(a — xiy, r C x mod y 343) 
if (I(x and y have the same sign 338) && liszero(r)) { 
int borrow = XP sub(r-»size, r-»digits, 
y-»digits, r-»digits, 0); 
assert(borrow == 0); 
normalize(r, r-»size); 


1 
AP. free(&q) ; 
return r; 
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18.3.4 RE 


第 :个 参数 p WUE, AP powIREDO, MEAL , AP_powiéibel (x? ) mod p. 


(functions 335)+= 
T AP_pow(T x, Ty, T p) f£ 
Tz 


assertOO ; 
assert(y); 
assert(y-»sign -- 1); 
assert(!p || p-»sign-- 
(special cases 344) 
if (p) 

(z — x” mod p 346) 
else 

(Z< x” 345} 
return z; 





1 && liszero(p) && !isone(p)); 


} 


(macros 337)+= 
#define isone(x) (GO -»ndigits--1 && (x)-»digits[0]--1) 


为 计算 z=xy， 可 以 把 z 设 置 为 1 PEBE Rix, Seyrk. 问题 是 如 时 比较 大 ， 比 方 趾 200 位 上进 制 数 ， 
这 个 过 程 花费 的 时 间 就 会 比 宇 当 存在 的 年 代 还 归并 ， 一 些 数学 规则 可 以 简化 这 个 计算 ， 


QUY = O72072 QR 为 偶数 
ae Ë xY l lY yy. 如 果 x 不 为 偶数 
这 些 规则 允许 递归 调用 AP_pow , Zt RAR MARA ATER), BUSA RUE CDA Ace IG G1 
次 数 ) 与 lg y 成 比例 。x 或 7 为 0 或 1 时 ，H1 寺 0? =0、1 21, x?-1Xxl-x, ， 所 以 递归 到 达 最 低 
点 开始 返回 ， 这 些 特殊 情况 中 的 前 三 种 可 以 这 样 处 埋 : 
(special cases 344)= 
if Ciszero(x>) 
return AP new(0); 
if Ciszero(y)) 
return AP. new(1); 
if Csone(x)) 
return AP new((y is even 345) ? 1 : x-»sign); 


(y is even 345) 
C((y)->digits[0]&1) == 0) 


递归 实现 了 第 四 种 特殊 情况 以 及 上 上 述 等 式 描述 的 两 种 情况 ， 


(z € x” 345)= 
if Cisone(y)) 
z = AP_addi (x, 0); 
else í 
T y2 = AP rshift(y, 1), t = AP_pow(x, y2, NULL); 
z = AP. mul(t, t); 
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AP_free(&y2) ; 
AP_free(&t); 
if Clty is even 345)) { 
z = APLmul(x, t = z); 
AP_free(&t); 


} 


y E, (Mik ie — fr it Se y/2. 中间 铺 困 一 一 y/2 PB GO?) (x2 ) 一 一 就 会 被 释放 以 
避免 产后 无 法 访问 的 存储 器 区 域 。 

p 非 空 时 ，AP_pow 计 算 x* mod p. 如果 p>1， 人 实际 上 我 们 不 能 计算 xy ， 内 为 它 林 能 太 
Xa 举 个 例子 ， 如 果 x 是 个 10 位 十 进 制 数 县 y 为 200， 邦 么 x* 的 位 数 比 定 宙 中 的 原子 还 要 多 ; 
但 xz modP 是 个 很 小 的 数 。 下 列 关 于 模 数 乘法 的 数学 规则 可 用 于 避免 生成 的 数 太 大 ， 

(x- y) mod p = (x mod p): (y mod p)) mod p. 

AP mod RBA E Mmulmod 2t PI # FL SI. mulmod 使 用 AP_mod 和 AP_mul 实 现 

x “ymod Pp， 清 注意 ， 要 释放 临时 结果 x C y. 


(static functions 335)+= 
static T mulmod(T x, T y, T p) í 
T z, xy = AP_mul(x, y); 
z = AP_mod(xy, p); 
AP_free(&xy); 
return z; 


1 


piks8t, AP_pow {USER fmulmod H] T3E IK. pf 36/33 HAP pow VA Ay Jy oF 81x DUI 
RA mod p, JLP SpA IE E UR HE 


(z — x" mod p 3465 
if Cisone(y)) 
z = AP mod(x, p); 
else { 
T y2 = AP_rshift(y, 1), t = AP_pow(x, y2, p); 
z = mulmod(t, t, p); 
AP_free(&y2); 
AP. free(&t) ; 
if (My is even 345)) { 
Zz = mulmod(y2 = AP_mod(x, p), t = z, p); 
AP_free(&y2); 
AP_free(&t); 


18.3.5 比较 


Xx 和 y 的 比较 结果 取决 于 它们 的 符号 和 数值 x<y 、x=y 或 x>y 时 ，AP_emp 返 问 一 个 小 于 0 、 
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等 天 或 大 于 0 的 值 。 如 果 x 与 y 符 号 不 同 ，AP_cmp 可 以 仪 返回 x 的 符号 ; GM, QH 3 VC 
们 的 数值: 


(functions 335)+= 
int AP_cmp(T x, Ty) í 

assert(x); 

assert(y); 

if (lx and y have the same sign 338)) 
return x->sign; 

else if (x-»sign 1 
return cmp(x, y); 





else 
return cmp(y, x); 


Y 


Xx 和 ?都 为 止 时 ， 如 果 Ixl<ly1， 则 x<y， 诸如此类。 然而 ,x 和 y 都 为 负 时 ， 如 果 Ixl>ly1， 则 xX<y， 
第 二 次 调用 mp ， 参 数 顺序 都 匡 倒 过 来 『 。cmp 核 对 不 同 长 度 的 操作 数 之 后 ，XP_cmp 执 行 实 
际 的 比较 。 


(static functions 3354 
static int cmp(T x, T y) í 
if (x->ndigits != y-»ndigits) 
return x-»ndigits - y-»ndigits; 
else 
return XP cmp(x-»ndigits, x-»digits, y->digits); 
Y 


(prototypes 3384 
static int cmp(T x, T y); 


18.3.6 简易 函数 


这 6 个 简易 函数 把 AP_T 作 为 第 一 个 参数 ， 把 一 个 有 符号 长 整 型 作为 第 二 个 参数 .每 个 函 
数 都 传递 给 set .个 长 整 型 来 初始 化 一 个 临时 的 AP_T， 然后 调用 - 些 更 常用 的 操作 。 
AP_addi 说 明了 这 种 方法 。 


(functions 335)+= 
T AP.addi(T x, long int y) { 
(declare and initialize t 347) 
return AP_add(x, set(&t, y)); 
} 


(declare and initialize t 347)= 
unsigned char d[sizeof (unsigned long)]; 
struct T t; 
t.size = sizeof d; » 
t.digits = d; 


ER BRR H TE ARER TERE, Tete AMO MR WAP_T A SCH GAN digits BEAR, 


任意 精度 部 法 


255 





3k K Vl D digits Hen MA NER THES KK OX oboe PK. 


Fs + 022 oR ROR GR B : 
(functions 
T AP.subi(T x, long int y) í 
(declare and initialize t 347) 
return AP sub(x, set(&t, y)); 
} 


T AP_muli(T x, long int y) { 
(declare and initialize t 347) 
return AP_mul(x, set(&t, y)); 

} 


T AP.diviCT x, long int y) { 
(declare and initialize t 347) 
return AP div(x, set(&t, y)); 

} 


int AP_cmpi(T x, long int y) { 
(declare and initialize t 347) 
return AP_cmp(x, set(&t, y)); 
} 


APF_modi 比 较 古 怪 ， 央 为 它 返 回 一 个 长 整 型 
AP_mod 返 回 的 AP_T。 


(functions 335)+= 
long int AP_modi(T x, long int y) 
long int rem; 
Tr; 


(declare and initialize t 347) 

r = APLmod(x, set(&t, y)); 
rem = 
AP_free(&r); 
return rem; 


} 


18.8.7 移 位 


而 不 是 - -个 AP_T 或 整 型 ， 而 且 它 必须 放弃 


XP_toint(r->ndigits, r->digits); 


两 个 称 位 落 数 都 调用 它们 的 XP 相关 函数 移动 它们 的 操作 数 。 对 于 AP_lshift， 结 果 比 操 


WS [9/8] 位 数 ， 且 与 操作 数 符号 相同 。 


(functions 335) 
T AP.Ishift(T x, int s) í 


T z; 

assert(x); 

assert(s >= 0); 

z = mk(x-»ndigits + ((s+7)&-7)/8); 
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XP_Ishift(z->size, z-»digits, x-»ndigits, 
x-»digits, s, 0); 

z-»sign = x-»sign; 

return normalize(z, z-»size); 


} 


对 于 AP_rshift ， 结 果 字 节 数 减少 L578| ， 而 及 可 能 结果 为 零 ， 这 种 情 况 下 它 的 符 导 必 须 为 正 。 


T AP_rshift(T x, int s) { 
assert(x); 
assert(s >= 0); 
if (s >= 8*x-»ndigits) 
return AP. new(0) ; 
else { 
T z = mk(x-»ndigits - s/8); 
XP_rshift(z->size, z-»digits, x-»ndigits, 
x-»digits, s, 0); 
normalize(z, z-»size); 
z->sign = iszero(z) ? 1 : x-»sign; 
return z; 


了 
这 请 句 米 处 理 s 指 定 的 移 位 位 数 大 十 战 等 十 x 的 位 数 的 情况 ， 


18.5.8 字符 串 和 整数 转换 


AP_toint (x) 返回 一 个 与 x 符 苇 相 癌 、 值 等 于 Ixl mod (LONG_MAX+1) AIK sn. 


(functions 335)+= 
long int AP toint(T x) í 
unsigned long u; 


assert(x); 
u = XP-toint(x-»ndigits, x->digits)%(LONG_MAX + TUL); 
if (x->sign == -1) 
return -(long)u; 
else 
return  (long)u; 


H 
Eb AP BS BOEAP Tsté BORSER DRE SHEER Ha AP_T. AP. fromstrii —4- 98 
惠 转换 成 AP_T， 它 接收 一 个 具有 如 下 语法 的 有 符号 数 : 
number = { white }{- | +] { white } digit { digit } 
这 里 white 表 不 空格 宇 符 ，digit 是 特定 底数 下 的 一 个 数字 字符 ， 必 须 在 2 到 36 之 问 。 对 于 
超出 10 的 底数 ， 用 字母 说 明 那 些 大 于 9 的 数字 。 AP_fromst 调 用 XP_fromstr ， 而 且 表 到 非法 
字符 或 空 字符 时 就 停止 扫描 它 的 字符 中 参数 . 


(functions 335)Hs 
T AP.fromstr(const char *str, int base, char **end) [ 


EMRE 
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Tz 
const char ^p = str; 
char *endp, sign = 'NO'; 


int carry; 2 


assert(p); 
assert(base »- 2 && base «- 36); 
while (*p && isspace(*p)) 





sign = *pe«; 

(Z< 0 351) 

carry = XP_fromstr(z->size, z->digits, p, 
base, &endp); 





assert(carry == 0); 
normalize(z, z->size); 
if Cendp == p) í 
endp (char *)str; 
z = AP_new(0); 
} else 
z->sign = iszero(z) {| sign !- '-' ? 1: -1; 
if Cend) 
*end = (char *)endp; 
return 2; 


H 
AP_fromstr 把 endp 的 地 址 传递 给 XP_fromstr， 因 为 
检查 非法 输入 。 如 果 end 非 空 ，AP_fromstr 就 把 *end 设置 成 cndp 





要 知道 吓 什么 终止 了 | 描 ， 这 样 才能 


z 中 的 位 数 是 0. Ig base ， 这 里 n 足 字符 中 中 数字 个 数 ， 央 而 z 的 XP_T 必 须 有 一 个 至 少 
m=(n + lg base)/8 F +; fgdigits WAH, IR base 2^; m=n + lg (29/8-k - n/8- 这样， 如 果 我 
AGTEK. (I2 DU AE F RA Phase Uw bi, MAZES < n/8] 位 数 。k 是 对 以 base 为 
底数 的 每 个 数字 位 数 的 保守 估计 ， 例 如 ，base HOR}, ATOKA 10 ~3.32 位 ，k 为 4。 


base 为 2 时 ，k 从 1 开始 base 为 36Hjk 达 到 了 6- 


{ze 0 351)= 
{ 
const char *start; 
int k, n= 0; 


for ( ; *p == '0' && p[1] == '0'; p++) 

start = p; 

for ( ; (*p isa digit in base 352); p++) 
n++; 


for (k = 1; (1««k) < base; k++) 


z= mk (CCk#*n + 7)8-7)/8); 
p = start; 
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(*p is a digit in base 352)= 
&& *p '9' && *p < '0' + base 
&& °p <= 'z' && *p < 'a' + base - 10 
&& *p <= 'Z' && *p < 'A' + base - 10) 

<z—0 351» PHS — 4 (ESRB RE 6 BIB 0 E 

AP.tostr if EX (EHI 2842468738 IE DA TE BUG mo basei HRM], Di EL 414 m. xil 
digits RA TA 004" c m-(n + lg basey8. WR APR Yoh fat S T base (Pf 4-8 gut 
WS KAR. JZ m=n dg Q*US-k -n/8, fin [8m/k]. tT null 字 符 还 要 加 1 ,这 
E, k 向 下 低估 每 个 数字 以 base 为 底数 进行 才 孙 的 bi 数 ， 这 样 n 就 中 所 请 数字 位 数 的 一 个 保 宁 
估计 ， 例 如 ，Pase 为 10 时 ,，x 中 任 个 数字 都 会 生成 &1g 10 一 2.41 十 进 制 数位 ， 晶 k 为 3, ， 因 此 x 
的 每 个 数字 都 分 配 了 873] = 3 个 十 进 制 数位 的 空间 。 base X368 [E A5 开始 ; base 为 2 则 达到 ] 。 








(size — number of characters in str 352)= 


{ 
int ki 
for (k = 5; (1««k) > base; k--) 
size = (8*x-»ndigits)/k +1 + 1; 
if (x->sign == 1) 
size++; 
} 





AP_tostr 直 XP_tostr 计 算 x 的 字符 表 


(functions 335 
char *AP tostr(char *str, int size, int base, T x) { 
XP Tq; 


assert(x); 
assert(base >= 2 && base <= 36); 
assert(str == NULL || size > 1); 
if (str == NULL) í 
(size — number of characters in str 352) 
str = ALLOC(size); 
} 
q = ALLOC(x->ndigits); 
memcpy(q, x-»digits, x-»ndigits); 
if (x-»sign -1) í 
str[0] = '-'; 
XP.tostr(str + 1, size - 1, base, x-»ndigits, q); 
] else 
XP_tostr(str, size, base, x->ndigits, q); 
FREE (q); 
return str; 











} 


最 后 一 个 AP 两 数 是 AP_fmt ， 这 总 用 I4] SVAP_T AVE me ER MH, l ERIAP_tostr 
以 上 进 制 格式 化 数值 ， 并 调用 FEmt_putd 进行 打印 。 
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(functions 335)+= 
void AP_fmtCint code, va list “app, 
int put(int c, void *c1), void *cl, 
unsigned char flags[], int width, int precision) { 
T x; 
char *buf; 


assert(app && flags); 

x = va_arg(*app, T); 

assert(x); 

buf = AP tostr(NULL, 0, 10, x); 

Fmt putd(buf, strien(buf), put, cl, flags, 
width, precision); 

FREE(buf): 


参考 书目 浅 析 


AP.T 类 似 于 一 些 编程 语言 中 的 “大 数 "。 例如， 最 近 版 本 的 Icon N7 -种 整数 类 型 ， 但 
可 以 根 氛 需要， 使 用 任意 精度 的 算法 来 表 朱 计算 得 到 的 值 。 程 序 员 不 需要 区 分 机 器 整数 和 任 
意 精 度 整数 ， 

任意 精度 算法 的 工具 经 常 作为 一 个 体 准 库 或 包 基 供 。 例 如 ，LISP 系 统 有 包括 大 数 包 的 长 
整 型 ， 还 有 类 似 的 ML 人 包 。 

REBT TERR HMM TERE, AE CM, fid, 
Mathematica (Wolfram 1988 ) 提供 任意 长 度 的 整数 和 有 茸 数 ， 旦 有 理 数 的 分 子 和 分 母 都 是 
任意 精度 的 整数 。 妇 个 符号 过 算 系统 Maple V (Char etal. 1992 ) 也 有 类 似 的 工具 , 


练习 


18.1. 每 次 油 用 AP_div 利 AP_mod 的 时 筷 ， 它 们 都 会 分 配 攻 放 临 时 空间 。 修 改 这 两 个 函 
3. 让 它们 共享 tmp ， 只 分 配 一 次 tmp ， 跟 踪 它 的 大 小 、 并 根据 需要 进行 扩充 。 

18.2 有 一 种 与 使 用 重复 乘 方 和 相 乘 计算 z = ocn Hn DH DL BU SI AES (参见 Knuth 1981 的 
4.6.3 节 )，AP_pow 中 使 用 的 递归 算法 等 价 ， 


Zcxuecl 

while y > 1 do 
if yis odd then u — u: z 
zez 
ye y2 

ZecewWwz 


选 代 通 常 比 递 归 快 一 些 ， 但 是 这 种 方法 的 真正 优点 是 它 为 中 间 结 果 值 分 配 的 空间 
Hb €. 使 用 这 种 算法 重新 实 砚 AP_pow ,并 度量 改进 的 时 间 和 空间 。 了 明显 
地 看 出 这 个 算法 优 填 递归 算法 ,x 和 y 必 须 取 多 大 值 ” 
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实现 AP_ceil (AP. T x, AP. T y) AP floor (AP. T x. AP T y), 返回 x/y 的 最 
TRE BEA EAR PRE. —E EA Mix Riy FESSES BOTE OG. 
APHEO SER “Wk” —AAMW BR, WARAR Hi Amu BM. eit 
并 实现 一 个 新 的 接口 Seq THER. ARA RIN ZUR. FBR. HE 
SURE xA BY RED EE LUE. AE R EEI B. 
实现 一 个 AP 函数 生成 随机 数 ， 夫 匀 分 布 于 特定 范围 。 
设计 一 个 接 D ， 其 功能 实现 以 任意 a 为 模 的 计算 ， 并 用 此 接收 和 返 思 0 到 nm -1 之 间 
整数 集合 小 的 值 。 要 注意 除法 : 仅 当 该 集合 为 有 有 限 域 ， 即 p 为 素数 时 才 有 定义 。 
两 个 a 位 数 相 乘 要 花费 的 时 间 与 m2 成 比例 ( 参见 17.2.2 节 ).. A. Karatsuba ( 在 1962 
年 ) 说 明了 如 何 实现 乘法 时 间 与 41 汉 成 比例 ( 参 区 Geddes 、Czapor SLababn 
1992 的 4.3 节 以 及 Knuth 1981 的 4.3.3 节 ) 一 个 4 位 数 x 可 以 分 成 最 高 有 效 及 最 低 有 
效 的 m12 位 数 之 和 ; 即 x = aB"?+b， 因 此 ， 乘 积 xy 可 以 写作 
xy = (aB"? + bcB” ?4d) = acB" + (ad+ bcyE" + ba, 
需要 由 次 乘法 和 一 次 加 法 。 中 间 项 的 系数 可 以 重新 写成 : 

ad+be = ac+hd+ia-byd-c). 
乘积 xy 仅 需要 三 次 乘法 (ac, bdB(a-b)Xd-c)). PRA RRR. 如果 rm 很 
大 ， 可 以 中 间 结 果 占 用 的 空间 为 代价 ， 保 在 -个 mr2 位 乘法 ， 来 减少 乘法 的 执行 时 
问 ， 使 用 Karatsuba 的 算法 实现 一 个 递归 的 AP_mul ， 确 定 np 为 何 值 时 会 明显 快 于 以 
前 那个 通用 算法 。 使 用 XP_mul 完 成 中 间 计 算 ， 





第 19 章 多 精度 算法 


这 三 种 精度 算法 接口 的 最 后 一 种 . MP、 导 出 了 用 于 实现 无 符 史 整 数 和 二 进 制 补 码 整 数 
多 精度 算法 的 函数 。 与 XP 相同 MP 展现 了 它 对 于 n 位 整数 的 表示 形式 ， 且 MP 随 数 处 理 的 是 
给 定 大 小 的 歼 数 。 与 XP 不 同 的 地 方 在 于 MP 整数 的 长 度 是 以 位 (bit ) 给 出 的 ,而且 MP 的 应 
数 既 实现 了 带 符号 算法 也 实现 了 无 符号 算法 。 和 AP 一 样 ，MP 函 数 推行 了 一 组 常用 的 可 检查 
的 运行 期 错误 。 

MP 计划 用 于 需要 基 展 精 度 算法 但 想 灵 活 控制 内 存 分 配 、 或 者 既 需 要 无 符号 操作 义 需 要 
有 符号 操作 、 抽 或 必须 模拟 二 进 制 补 碚 的 n 位 数 算法 的 应 用 程序 。 范 例 包 括 使 用 加密 的 编译 
器 和 应 用 程序 。 一 些 现代 加 密 算法 涉及 到 了 数 开 位 辕 定 精度 整数 的 处 理 。 

一 些 编译 器 必须 使 用 多 精度 整数 。 交 叉 编 详 器 运行 在 X 平 台 并 在 ?平台 生成 代码 。 如 果 Y 
的 整数 比 X 大 ， 编 详 器 就 会 使 用 MP 处 理 Y 大 小 的 整数 同样， 编译 器 必须 使 用 多 精度 算法 把 
浮 点 常数 转换 成 与 它们 所 指定 的 最 接近 的 浮 点 值 。 


19.1 接口 


MP 接口 内 容 很 多 一 一 包括 49 个 函数 太 岗 个 并 常 一 一 因为 它 导 出 fn 位 有 符号 整数 及 无 符 
号 整数 的 一 组 完整 算法 函数 。 


(mp.h)= 
#ifndef MP_INCLUDED 
#define MP_INCLUDED 
#include <stdarg.h> 
#include <stddef.h> 
#include "except.h" 


#define T MP_T 
typedef unsigned char *T; 


(exported exceptions 459) 
(exported functions 358) 


fundef T 
fendif 


与 XP 相同 , MP 表明 mn 位 整数 需要 用 [18] 字 季 米 表示 ， BORE SE 首先 存储 最 低 有 效 字 节 。 
MP 使 用 二 进 制 补 码 形 民 表示 有 符号 整数 ， 第 m_1 位 是 符号 位， 

与 XP 不 同 的 是 ，MP 男 数 实现 了 常用 的 可 检查 的 运行 期 错误 ， 例 如 ， 向 该 接口 的 任 一 范 
数 传递 空 MP_T 即 为 - .个 可 检查 的 运行 期 错误 。 但 是 ， 如 果 传 递 的 MP_T 太 小 而 不 能 容纳 n 位 
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ER, RH EPPA AINEITA E 
MP 自动 初始 化 以 在 32 位 整数 上 执行 算法 ， 调 用 : 


(exported functions 358)= 
extern int MP set(int n); 


修改 MP， RKE MER m BD BJ HDI LEE. MP, seGR Paymi AN. Hm RR  21 为 
可 检查 的 运行 期 错误 - 一 经 初始 化 ， 大 多 数 应 用 程序 都 使 用 只 有 -种 大 小 的 扩展 整数 。 举 个 
[358] BH. SE LER VES STRE R ETL 28 EDU TE TERRIER EO DOBEEEHOU Gk He nur HERE s 
它 简 化 了 其 他 MP pO UU GE FJ, ef (e MB BT A. Rm a — PE m T S W. URS 
化 ， 但 是 更 重要 的 一 个 简化 是 ， 对 源 参数 和 日 的 参数 部 没有 了 限制 ， 相同 的 MP_T 可 以 -E 
作为 源 和 目的 出 现 。 由 于 一 些 盟 数 所 丙 要 前 临时 空间 仅 依 束 于 nm， 这 样 可 以 由 MP_set 一 次 分 
配 ， 因 此 消除 这 些 限 制 成 为 现实 。 
这 种 设 寸 也 各 免 了 内 任 分 配 。MP_set 可 以 引发 Mem_Failed ， 但 其 他 48 个 MP 函数 中 仅 有 
4 个 执行 内 存 分 配 。 其 中 之 - .是 


(exported functions 358)+= 
extern T MP new(unsigned long u); 


这 个 函数 分 配 -个 适当 大 小 的 MP_T， 并 初始 化 为 u ， 然 后 返回 。 


(exported functions 358)+= 
extern T MP_fromint (T z, long v); 
extern T MP_fromintu(T z, unsigned long u); 


{Ez BTE Bv RUR A z, 如果 n 位 数 u 或 Yy 不 匹配 ,MP_new、MP_fromint 及 MP_fromintu 就 


会 引发 


(exported exceptions 359)= 
extern const Except_T MP_Overflow; 


ug t2"—-1h{ , MP_new #IMP_fromintu4] £MP Overflow; vy 小 十 _2*-1 BEA F271 AY, 
MP_fromint 引 发 MP_Overflow . 
所 有 的 MP 函数 都 在 引发 异常 之 前 计算 它们 的 结果 、 只 不 过 是 需 齐 了 附加 位 。 例 如 ， 
MP_T z; 
MP_set(8); 


z = MP_new(Q); 
MP_fromintu(z, OxFFF); 


把 z 设 置 为 0xXFF 并 引发 MP_Overflow 。 客 户 调 用 程序 可 以 在 适当 的 时 候 ， 用 一 个 TRY- 
[359] EXCEPT 语 名 忽略 这 个 异常 。 例 如 ， 


MP_T z; 
Mp_set(8); 
z = MP_new(0); 
TRY 
MP_fromintu(z, OxFFF); 
EXCEPT(MP Overflow) ; 
END. TRY ; 
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düzit SOxFFJEE 7p í X Pie UNES 
这 个 转换 并 不 适用 于 


(exported functions 358)+= 
extern unsigned long MP tointu(T x); 
extern long MP toint (T x); 


RA BORE RELIER VES EK ERO EI SHE BRO IBI. x FE ELSE Be ps, 2 
引发 MP_Overflow , MR FE SEn SBE ARR SR. EP VIR BFE RT DUE HH 
{exported functions 3584 


extern T MP cvt (int m, Tz, T x); 
extern T MP. cvtu(int m, T z, T x); 


把 x 转换 成 适当 大 小 的 MP_T。MP_cvt 和 MP ev 把 x 转换 成 一 个 四 位 有 符 叶 或 无 符号 MP_T 并 
存 于 z， 然 后 返 同 z。 症 位 日 的 单元 格 不 匹 卫 xz 时 ， 这 些 函数 会 引发 MP_Overflow ， 但 是 之 前 
会 设置 z。 央 而 


unsigned char z[sizeof (unsigned)]; 
TRY 
MP_cvtu(8*sizeof (unsigned), z, x); 

EXCEPT(MP_Overflow) ; 

END_TRY; 
把 z 设 置 成 x 的 8 - sizeof(unsigned) ri RA BUR, MR Bx 的 估 小。 

中 超出 x 的 位 数 时 ，MP_cvta 用 0 扩展 结果 ，MP_cvt 刑 x 的 符 世 位 扩展 结果 。m 小 于 2 即 为 一 
个 可 检查 的 运行 期 错误 ;如果 z 太 小 不 能 容纳 下 位 的 整数 ， 就 是 -个 不 可 检 人 得 的 运行 期 销 误 。 


(exported functions 358)+= 





extern T MP add (T z, T x, T y); 
extern T MP. sub (Tz, Tx, T y); 
extern T M. mul (T z, T x, T y); 
extern T MP. div (Tz, Tx, T y); 
extern T MP_mod (T 2, T x, T y); 
extern T MP neg (T z, T x); 

extern T MP addu(T z, T x, T y); 


T T 
extern T MP subu(T z, T x, T y); 
extern T MP_mulu(T z, T x, T y); 
extern T MP. divu(T z, T x, T y); 
extern T MP modu(T z, T x, T y); 


B Fuks RARE ERE RAE SI ER ATT UB ， 无 符号 操 件 与 有 符 
号 操作 的 惟 区别 就 是 溢出 语义 . 下面 将 详细 介绍 MP_add 、 MP sub, MP. mul , MP. div, 
MP_mod 以 及 机 悄 的 无 符 导 函数 分 别 计算 = x+y ay 
JER lz. BUR K ax, y Kzfüift. MP. neglPtz itota 的 负数 ， 
MP div 和 MP_mod 向 负 无 穷 取 整 这样 x mod y 就 总 为 证。 


y. ¿= x/yy)jtz = x mod y. 
Blz. MAX Aly FF AD. 


+z 
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如 果 结 打 不 匹 肥 ， 所 有 这 些 函数 ,除了 MP_divu 和 MP_modu ， 部 会 引发 MP_Overflow。 
X<y 时 MP_subu 引 发 MP_Overflow ; x 种 y 符 号 不 同 习 结果 的 符号 与 的 符号 不 同时 MP_sub 引 
发 MP_Overflow 。y 为 0 时 MP_divy , MP. divu, MP. mod &MP_modu3|# 


(exported exceptions 359)+= 
extern const Except T MP Dividebyzero; 


when y is zero, 


(exported functions 358)+= 
extern T MP_mul2u(T z, Tx, T y); 
extern T MP_mul2 (T z, T x, T y); 
BM MRE KER: 它们 部 计算 z = x. y, Mezat. AA lz. BA, BRRS 
出 。z 太 小 而 不 能 容纳 2 位 数 时 产生 一 个 个 可 愉 查 的 运行 期 错误 。 请 注意 ， 既 然 z 必 须 容纳 2n 
位 ， 它 就 不 能 由 MP_new 进 行 分 配 。 
简易 浮 数 接收 一 个 无 符号 长 整 型 或 整 型 立即 数 作为 它们 第 二 个 操作 数 ， 


(exported functions 358)+H= 


extern T MP_addi (T z, T x, long y); 
extern T MP_subi (T z, T x, long y); 
extern T MP_muli (T z, T x, long y); 
extern T MP_divi (T z, T x, long y); 
extern T MP_addui(T z, T x, unsigned long y); 
extern T MP_subui(T z, T x, unsigned long y); 
extern T MP_mului(T z, T x, unsigned long y); 
extern T MP_divui(T z, T x, unsigned long y); 


extern long MP_modi (T x, long y); 
extern unsigned long MP_modui(T x, unsigned long y); 


当 这 些 函 数 的 第 二 个 操作 数 初 始 化 为 时 、 就 等 价 十 它们 相应 的 更 通用 的 函数 了 ， 它们 也 引 
发 类 似 的 异常 。 例 如 ， 


MP_T z, x; 
long y; 
MP-muli(z, x, y); 


等 价 于 


MP_T z, x; 
long y; 
t 
MP_T t = MP. new(0) ; 
int overflow = 0; 
TRY 
MP fromint(t, y); 
EXCEPT (MP. Overflow) 
overflow = 1; 
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END. TRY; 
MP mul(z, x, t): 
if Coverflow) 
RAISE(MP. Overflow); 
1 


但 是 ， 简 易 函 数 不 进行 内 存 分 配 - HIER, WD ACA, RAMA, GDPEMP divui 
和 MP_modui, 会 引发 MP_Overflow， 但 是 它们 在 计算 完 z 之 后 引发 。 





(exported functions 358)+= 
extern int MP_cmp (T x, T y); 
extern int MP_cmpi (T x, long y); 


extern int MP_cmpu (T x, T y); 
extern int MP_cmpui(T x, unsigned long y); 


比较 x 和 y ， 而 且 在 zx<y、x=y 或 *>? 时 依次 返 问 小 于 0、 等 于 0 或 大 寺 0 的 一 个 值 MP_cmpi fl 
MP_cmpui 并 不 一 定 要 y 匹 配 MP_T; 它们 只 是 比较 x 和 y-。 
下 列 函 数 把 它们 的 输入 MP_T 作 为 an 位 的 字符 中 : 


(exported functions 358)+= 
extern T MP and (T z, T 
extern T MP. or (T z, T 
extern T MP. xor (T z, T 
extern T MP.not (T z, T 


extern T MP. andi(T z, T x, unsigned long y); 
extern T MP.ori (T z, T x, unsigned long y); 
extern T MP xori(T z, T x, unsigned long y); 


MP. and, MP or, MP. xor A'iz ff 8G H SOM NER Boz t BR x Ply He. AOR RHEE 
OR HY 47% JFK Wz, MP notiBz BE ox A itt WTS, I lz, ORM RSH, H 
ie RE Ay KCK BD RSMAS. (an, 


MP_T z, x; 
unsigned long y; 
MP_andi(z, x, y); 


等 价 寺 


MP_T z, x; 

unsigned long y; 

{ 
MP_T t = MP_new(0); 
TRY 

MP. fromintu(t, y); 

EXCEPT(MP. Overflow) ; 
END. TRY; 
MP.and(z, x, t); 
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但 是 ， 这 些 函 数 中 没有 一 个 执行 任何 内 存 分 配 . 
= tie BK 


(exported functions 358)+5 
extern T MP_Ishift(T z, T x, int s); 
extern T MP rshift(T z, T x, int s); 
extern T MP ashift(T z, T x, int s); 


实现 逻辑 和 算术 移 倍 。 MP Ishiftft 22s fu fx BR Pz; MP. rshiftf 4235s u x RR Yz. 这 两 
个 函数 都 用 0 填充 定 测 的 位 ， 然 后 返回 z。MP_ashift 跟 MP_rshift - 样 ， 只 是 空 出 的 位 是 用 x 的 
符号 位 填充 的 。s 为 负 则 产生 -个 可 检查 的 运行 期 错误 。 

下 列 函 数 实现 MP_T 与 字符 中 之 间 的 转换 


(exported functions 3584 
extern T MP_fromstr{T z, const char *str, 
int base, char **end); 
extern char *MP tostr (char *str, int size, 
int base, T x); 
extern void MP. fmt (int code, va list *app, 
int putCint c, void *cl), void *cl, 
unsigned char flags(], int width, int precision); 
extern void MP fmtu (int code, va list *app, 
int putCint c, void *c1), void *c1, 
unsigned char flags[], int width, int precision); 


MP. fromstritistr h g f AUREUM A base 为 底数 的 无 符号 整数 ， 并 将 这 个 整数 赋予 z， 
然后 返 网 。 它 忽略 前 而 的 空格 ，base 为 一 位 或 多 位 数 。 对 于 大 十 10 的 base， 则 用 小 写字 母 
利 大 写字 母 说 明 9 以 外 的 数字 。 MP_fromstr 和 strtoul 一 样 ， 如 果 end 非 空 ，MP_fromstr 把 end 
STE IEEE OS. str dg NAR. tend ye, 
MP_fromstr 就 把 x*end 设 忱 成 str， 然 后 返 如 果 str 中 的 字符 冲 所 指定 的 整数 太 大 ， 
MP. fromstr 3k j| EMP. Overflow, str, sk base; 本 2 或 大 于 36 都 会 产生 吕 检 查 的 运 
行 期 错误 。 

MP_tostr 用 一个 以 base 为 底数 吉水 x 的 非 终 小 字符 中 赴 针 str[0,.size-1] .并 返回 str。 如 果 
StI 为 窄 ，MP_tostr 就 忽略 size， 并 分 配 必要 的 字符 中 ， 蛮 户 调 用 程序 应 负责 释放 这 个 字符 
串 。 如 果 str 非 空 、size 太 小 而 不 能 容纳 这 个 非 终止 结果 、 或 者 base 小 于 2 或 大 十 36， 都 会 产生 
一 个 可 检查 的 运行 期 错误 。str 为 空 时 , MP. tostrZ:5| Mem, Failed | 

MP-fimt 和 MP_fmtu 是 用 于 打印 的 Fmt 祥 式 转换 函数 。 这 两 个 咕 数 都 使 用 .个 MP TAS — 
个 base ; MP_fmt 使 用 与 printf 的 %d 转 换 的 相同 规则 把 一 个 有 有 符号 MP_T 转 换 成 个 字符 由， 
MP_fmtu 使 用 printf 的 多 4 转换 规 则 转换 无 符号 MP_T 两 个 所 数 都 可 以 引发 Mem_Failed , 如 
Rapp ilag 为 空 ， 则 为 -一 个 可 检查 的 运行 期 错 演 ， 


19.2 FA: 另 一 计算 器 
mpeale Seale ^E. FUE ER Fin fz te BCL ETT A APD ALE St XT os OLR 
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MP 接 11 的 使 用 ， 与 calt dial, mpral s Hik = la fRTT SA Nik: 值 推 人 堆栈 顶端 ; 操作 符 从 
Bip t IE BE FE BODH ARH AHER. EO T BA BOERI -Ak £ PHL SB RE 


Fy 把 作 符 如 下 

~ HER & 58 

+ MH |o BE 
减法 ^ RR 

* R < EB 

/ 除法 > FE 

% H 1! HdE 

i — PUE A pes o 设置 输入 底数 

k AE c ， 清空 堆栈 

d ”复制 栈 项 数值 

p Hm 

q HH 


容 格 字符 用 村 分 隔 数 值 但 本 身 会 被 忽略 不 记 ; 其 他 字符 部 声明 为 木 被 识别 的 运算 符 。 堆 
栈 的 大 小 仪 受 限 于 可 用 存储 器 ， 伺 足 诊断 程序 会 声明 堆栈 下 溢 ; 

命令 nk ， 指 定 mpcalc 处 理 的 整数 大 小 ， 共 中 mn 至 少 为 2; 默认 为 32。 执行 操作 符 E 时 堆栈 

必须 为 空 ， 操 作 符 [和 o 指 定 输入 和 答 出 底数 ; 歌 认 情况 下 这 两 个 底数 都 着 10。 当 输入 底数 大 

于 108j ， 数 值 的 前 TAT 必须 在 0 与 9 之 间 ~ 

如 果 输 出 底数 是 2 、8 或 16，、 操 作 符 + 、=、*、/ SOMMER, MBE 
和 f 和 打印 无 符号 数值 。 操 作 符 ~ 总 是 执行 有 符号 算法 .操作 符 久 1^! < 与 > 总 足 将 它们 的 操作 
数 解释 为 无 符号 数 

MH MERI E I mpeale AT 明 。 对 十 溢出 ,这 种 情况 下 的 结 朵 就 是 数值 中 最 低 
nha RR. mR TS. ER BLO 

mpealc 的 整体 结构 很 像 cale 的 结构 : ARA TFE BUE DA MAS HE RE, 


(mpcaic.c)- 
#include «ctype.h» 
#include <stdio.h> 
#include <string.h> 
#include <stdlib.h> 
#include «limits.h» 
finclude "mem, h" 
finclude "seg.h" 
#include "fmt.h" 
#include "mp.h" 


impcalc data 367) 
impcalc functions 367) 


止 如 seq.h 的 包含 文件 所 表明 的 部 样 ，mpcalc 的 堆栈 使 用 NS: 
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(mpcalc data 367)= 
Seq_T sp; 


(initialization 367) 
sp = Seg new(05; 


THE e JN FlSeq addhiE A HER, HHA JH Seq remhisiuh MERE RU. EA 978 BJmpcalc 5 Ë RAE 
调用 Seq_rembi， 内 此 它 把 所有 的 弹出 操作 封装 在 一 个 检查 下 洲 的 隔 数 中 : 


(mpcale functions 367)= 
MP_T pop(void) í 
if (Seq length(sp) > 0) 
return Seq_remhi (sp); 
else { 
Fmt_fprint(stderr, "?stack underflow\n"); 
return MP new(0); 


l 
与 calc 的 pop 一 样 ，mpcalc 的 pop 也 总 是 返回 -个 MP_T、 BB AEE EOS EIN Ue RRL HE í $Ë 
误 检 查 。 
内 为 查处 再 MP 的 异常 ,mpcalc 的 证 循环 变 待 比 catc DU 35 HER gd 4e- de, mpcalc fj X A 
与 calc 的 主 循 坏 . - 样 ， 部 要 污 下 下 - -数值 或 操作 符 ， 并 根据 读 皮 内 容 进行 相应 操作 。 但 是 它 
还 要 为 操作 数 和 结果 建立 -- 些 MP_T， 而 且 人 还 使 用 TRY-EXCEPT 语 名 捕捉 异常 。 
(mpcalc functions 367)+= 


int main(int argc, char *argv[]) í 
int c; 


(initialization 367) 
while ((c = getcharO) != EOF) í 
MPT x = NULL, y = NULL, z = 
TRY 
switch (c) í 
(cases 368) 


NULL; 


了 
[367] EXCEPT(MP. Overflow) 
Fmt fprint(stderr, "?overflowXn"); 
EXCEPT(MP. Dividebyzero) 
Fmt fprint(stderr, "?divide by 0n"); 
END. TRY ; 
if (z) 
Seg. addhi(sp, z); 
FREEOO ; 
FREECy); 





} 
(clean up and exit 368) 
} 


(clean up and exit 368)= 
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(clear the stack 368) 
Seq. free(&sp); 
return EXIT. SUCCESS: 


x 和 y 用 作 操 作 数 ; z 用 作 结 果 。 如 果 选 中 一 个 操作 符 之 后 x Ry dE e. VEU LAE DICERE M Fë rh at 
出 的 操作 数 ， 内 此 必须 释放 x 和 y 的 内 存 空 间 。 如 果 z 非 空 ， 它 就 是 保存 着 结果 ,这 个 结果 必 
须 压 人 堆栈 。 这 种 方 泛 只 允许 出 现 一 次 TRY-EXCEPT 诸 句 ， 而 不 足 在 每 个 操作 符 的 代码 周 
围 都 司 以 出 现 - 


输入 字符 可 以 是 空格 、 数 值 的 首位 数字 、 一 个 操作 符 或 其 他 错误 的 输入 内 容 。 下 面 是 简 
单 的 情况 : 


(cases 368)= 
default: 
if Cisprint(c)} 
Fmt_fprint(stderr, "?'%c'", c); 
else 
Fmt_fprint(stderr, °?'\\%030'", c); 
Fmt_fprint(stderr, " is unimplemented\n"); 
break; 
' ': case '\t': case 'An': case '\f': case "\r': 
break; 
case 'c': (clear the stack 368) break; 
case 'q': (clean up and exit 368) 





case 





(clear the stack 368)= 
while (Seq length(sp) > 0) í 
MP_T x = Seq remhi(sp); 
FREEGO ; 
} 


数值 都 是 从 一 个 数字 开始 ; cale 收 集 数字 并 调用 MP_fromstr 把 这 些 数字 转换 成 - -个 MP_T。 
ibase 足 当前 的 输入 底数 。 


(cases 368)= 
case '0': case '1': case '2': case '3': case '4': 
Case '5': case '6': case '7': case '8': case '9': { 
char buf[512]; 
z = MP.new(0); 
(gather up digits into buf 369) 
MP.fromstr(z, buf, ibase, NULL); 
break; 
) 


(gather up digits into buf 369)= 
{ 


int i = O; 
for ( ; (c is a digit in ibase 369); c = getchar(}, i++) 
if Ci < Cint)sizeof (buf) - 1) 
buf [i] = c; 








368 








369 


#19 
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270 
if G > Gint)sizeof (buf) - 1) { 
i = Gnt)sizeof (buf) - 1; 
Fmt fprint(stderr, 
"?integer constant exceeds Xd digits\n", i); 
了 
buf[i] = 'NO'; 
if (c != EOF) 
ungetc(c, stdin); 
} 


AK HS (A RS E RS. WR 


(c is a digit in ibase 369) 


strchr (&"zyxwvutsraponnTk; ihgfedcba9876543210" [36-ibase] , 


tolower(c)) 
非 空 ， 字 符 就 是 个 以 ibase 为 底数 的 数字 。 
大 多 数 算 法 操作 符 的 有 相同 的 形式 : 


(cases 368)+= 








Case '+': (pop x &y, set z 370) 
case ' (pop x & y, Set z 370) 
Case '*': (pop x &y, set z 370) 





Case '/': (pop x & y, set z 370) 
case '%': (pop x &y, set z 370) 
case '&': (popx &y, set z 370) 
case '|': (popx &y, set z 370) 
Case '^': (pop x & y, set z 370) 
Case '!': 
case 


z 
~':z 





popO; MP_neg( 


" 


(pop x & y, set z 370)= 
Y = popO; x = popO:; 
z = MP-new(0); 


FRAT Oe Y 6 SET Agee, 
还 是 无 符 EE, 


(mpcaic data 367}= 
int ibase = 10; 


int obase = 10; 
struct { 
char *fmt; 


MP-T (*add)(MP T, MP T, 
MP.T (*sub) (MP T, MP T, 
MP_T (*mul) (MP T, MP T, 
MP_T (*div) (MP. T, MP. T, 
MP.T (*mod)(MP T, MP. T, 
} s = { "Xn", 
MP_add, MP sub, MP. mul 
u= (Nn, 
MP_addu, MP subu, MP mul 
*f = &s; 


Cf-»add)(z, x, y); break; 
(*f->sub)(z, x, y); break; 
Cf-»mul)(z, x, y); break; 
(*f->div)(z, x, y); break; 
(*f->mod)(z, x, y); break; 
MP.and(z, x, y); break; 
MP.or (z, x, y); break; 
MP_xor(z, x, y); break; 


popO; MP.not(z, z); break; 


Z, Z); break; 


j; Egg We AUER (EAB IK Ue mpcale ERIT E8343 


MP_T) ; 
MPT); 
MP_T); 
MP_T); 
MP_T); 


， MP.div, MP mod }, 


u, MP_divu, MP. modu }, 
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obase 1 8 HL ER. HW. ORCA 10, 上 且 f 指 向 ss 保存 着 指向 MP 有 符号 算法 函数 的 指针 _ 
操作 符 i 修 改 ibase ， 拘 作 符 o 修 改 obase; 这 两 个 操作 符 孝 让 f 重 新 指向 u 或 者 s : 


(cases 369)4— 
case 'i': case 'o': { 
long n; 
x = popO; 
n = MP_toint(x); 
if (n < 2 || n» 36) 
Fmt_fprint(stderr, "?Xd is an illegal baseNn",n); 
else if (c == 'i') 
ibase = n; 
else 
obase = n; 
if (obase == 2 || obase == 8 || obase == 16) 
f = gu; 
else 
f = &s; 
break; 


} 
如 果 y 不 能 转换 成 一 个 长 整数 (也 就 是 涪 ， 如 果 MP_toint 引 发 MP_Overflow ), 或 者 结果 整数 
不 是 一 个 合法 底数 ， 就 不 能 修改 底数 。 
s$ 和 u 结 构 也 有 一 个 Fmt 样 式 格式 的 字符 吊 ， 用 于 打印 MP_T。mpcale 用 %D 广 册 MP_fmt , 
BiU SEREMP, fmtu, 
(initialization 367) 


Fmt register('D', MP.fmt); 
Fmt. register('U', MP fmtu); 


这 样 , 人 >fmt 访 问 适 当 的 格式 字符 串 ， 挑 作 符 p 和 f 几 于 打印 MP_T。 请 注意 ，p 弹 出 它 的 
操作 数 并 赋 子 z 一 一 主 循环 中 的 代码 把 则 个 数值 再 庄 同 介 栈 硕 。 





Fmt_print(f->fmt, z = popO, obase); 
break; 
case 'f': í 
int n = Seq_length(sp); 
while (--n > 0) 
Fmt print(f-»fmt, Seq get(sp, n), obase); 
break; 
l 


把 {情况 下 的 代码 与 18.2 节 中 的 calc 的 代码 相 比 较 。 用 Seq_T 表 示 时 ， 很 容易 打印 堆栈 的 所 有 值 。 
移 位 操作 符 防止 不 合法 的 移 位 量 ， 并 按 顺 序 移动 它们 的 操作 数 : 


(cases 369)+= 
case '«': { (gets & z 372); MP_Ishift(z, z, s); break; } 


case '>': { (gets &z 372); MP rshift(z, z, s); break; } 
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(gets & z 372)= 


long s; 


= popO; 
= pop); 
= MP_toint(y); 





if (s < 0 1| s > INT MAX) í 


Fmt_fprint(stderr, 
"?%d is an illegal shift amount\n", s); 
break; 


如 果 MP_tointsl ZzMP Overflow, wis y MARE TRAKER, s DOE R ME 


Ms lL TU. 


共 余 的 情况 都 关 寸 操作 符 k 利 d : 


(cases 369)+= 


case 'k': í 


long n; 
x = popl); 
n = MP_toint(x); 
if (n < 2 || n > INT MAX) 
Fmt. fprint(stderr, 
"?Xd is an illegal precision\n", n); 
else if (Seq length(sp) » 0) 
Fmt_fprint(stderr, "?nonempty stack\n"); 


else 
MP_set(n); 
break; 
case 'd': í 
MP_T x = popO; 


z = MP_new(0}; 


Seq_addhi(sp, x); 
MP_addui(z, x, 0); 


break; 


} 


FEE, Wemz ik EIRE R RI ARH E A HER - 


19.3 实现 


(mp.ġ= 
#include 
#include 
#include 
#include 
#include 
#include 
#include 
#include 


«ctype.h» 
«string.h» 
«stdio.h» 
«stdlib.h» 
<limits.h> 
"assert.h" 
"fmt.h" 
"mem.h" 
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#include "xp.h" 
#inciude "mp.h" 


#define T MP.T 


(macros 374) 

(data 373) 

(static functions 389) 
(functions 374) 


(data 373) 
const Except. T MP Dividebyzero 
const Except T MP. Dverflow 


Í "Division by zero" }; 
{ "Overflow" }; 


"on 


XP 把 一 个 位 数 表示 成 [218] =(n-1)/8+1 字 V, RATA VIR HE On BOSE. 下 网 说 
明了 MP 如 何 解释 这 些 字 他 。 最 低 有 效 字 季 在 在 边 ， 地 六 从 右 向 左 递增 ， 
(n-1/8.— (n-1)/8-1 1 byte 0 





























bit n-1 


shift | 


符号 位 是 第 Rh-1 位 ， 也 即 (~-1)48 字 节 中 的 (4-1) mod 8 位 。 给 定 n，MP 除 把 4 保存 为 
mbits， 还 要 计算 二 个 重要 的 数值 ，nbytes- 一 保存 n 位 所 需 前 字 节 数 ，sbift_ ks C 
节 必须 有 移 的 位 数 ， 以 隔 开 符 呆 位 ; mb—shif EWER. JH TRR E- n32 


些 值 是 : 











(data 373}= 
Static int nbits 32; 
static int nbytes (32-1)/8 + 1; 
Static int shift = (32-1)X8; 
static unsigned char msb - OxFF; 


dub Bos, MPfffünbytessüshift iil] Af 7-42; 
(macros 374)= 
#define sign(x) COO [nbytes-1]»»shi ft) 
MP_set 修 改 这 些 值 ; 


(functions 374)= 
int MP set(int n) { 
int prev = nbits; 


assert(n » 1); 
(initialize 375) 
return prev; 
} 
(initialize 375)= 
nbits =n; 











373 
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nbytes = (n-1)/8 + 1; 
shift = (n-1)%8; 
msb = ones(n); 


(macros 374) 
#define ones(m) (~(~OUL<<(((n)-1)%8+1))) 
将 只 取 反 ， 左 移 @m-D%8-1 位 ， 形 成 跟随 -1) mod 8 + HOMIES, CH AMEE RRA f 
"P. En- mod 8+ 1 个 1。 如 此 定义 足 因为 除了 传递 给 MP_set 的 值 ， 这 些 1 还 用 于 n 的 其 他 值 。 
和 MP_div 一 样 ，MP_set 也 分 妃 一 些 虱 时空 亲 用 村 算法 函数 。 在 MP_set 中 只 执行 一 次 内 
存 分 配 ， 而 不 是 重复 在 算法 函数 中 执行 。MP_set 为 一 个 2 - nbyte+2 大 小 的 临时 变 车 和 -个 
nbyte A Js filly BF bt ¿Fñ i i eld _ 






(data 373}= 
static unsigned char temp[16 + 16 + 16 + 2*1642]; 
static T tmp[] = (temp, temp+1*16, temp+2*16, temp+3*16}; 


(initialize 375)+= 
if Ctmp[O] != temp) 
FREE(tmp[0]); 
if (nbytes <= 16) 
tmp[0] = temp; 
else 
tmp[0] = ALLOC(3*nbytes + 2*nbytes + 2); 
tmp[1] = tmp[0] + i*nbytes; 











tmp [2] mp[0] + 2*nbytes; 

tmp[3] = tmp[0] + 3*nbytes; 
nbytes 没 有 超过 16 或 n 不 越过 128 时 ，MP_set 可 以 使 用 静态 分 配 的 temp (S. + 2529 Fash a 
量 分 配 是 够 的 空间 。temp 旦 必需 的 、 央 为 MP 必须 初始 化 ， 就 好 像 已 经 执行 过 了 MP_set ( 32 ), 
K E RMP 函数 调用 XP 两 数 执 和 nbyte 数 的 实际 算法 ， 站 水 是 备 超 出 nbits 位 - 





MP_new 和 MP_ fromintu 阐 明了 这 个 方案 - 





(functions 374)+= 
T MP.new(unsigned long u) í 
return MP_fromintu(ALLOC(nbytes), u); 
} 


T MP_fromintu(T z, unsigned long u) { 
unsigned long carry; 


- assert(z); 
(set Z to u 376) 
(test for unsigned overflow 376) 
return z; 


H 


(set z to u 376)= 
carry = XP_fromint(nbytes, z, u); 
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carry |= z[nbytes-1]&-msb; 

z[nbytes-1] &- msb; 
dy SRXP_fromintik [i] JE Sivjcarry , nbytes 3 S Fu; 如果 carry WZ. nbytessk AEF. fg 
是 u 可 能 无 法 匹配 nbits 位 。MP_fromintu 必 须 确 保 z 的 最 高 有 效 子 入 中 的 8- (shift+1) 位 最 低 有 
效 位 部 是 0， MP_set 已 经 为 msb 做 了 准备 以 容纳 有 shift+l 个 1 的 掩 而. 内 此 ~msb 将 那些 在 舍 
FP HT 与 carry 进行 OR 运算 的 期 望 位 陪 离 村。 无 符号 溢出 测试 仪 仪 检测 carry ; 


(test for unsigned overflow 376)= 
if (carry) 
RAISE(MP_Overf Tow) ; 


请 注意 ， MP_fromintu 在 检测 溢出 之 前 设置 2， 止 如 这 个 接口 所 指定 的 ， 所 有 MP 函数 必 
须 在 引发 异常 之 前 设置 它们 的 结果 。 
检测 有 符号 溢出 史 加 复杂 - -点 ， 庆 为 它 述 依赖 涉及 到 的 操作 。MP_fromint 介 绍 了 一 个 简 
单 情况 ， 
(functions 374)+= 
T MP_fromint(T z, long v) í 
assert(z); 
(set z to v 377) 
if (v is too big 377)) 
RAISE(MP. Overflow); 


return z; 


} 
首先 ，MP_fromint 把 z 初 始 化 成 v 的 值 ， 注 总 仪 向 XP_fromint 传 递 E 数 : 


(set z to v 377)= 

if (v == LONG_MIN) ( 
XP_fromint(nbytes, z, LONG_MAX + 1UL); 
XP_neg(nbytes, z, z, 1); 

} else if (v < 0) ( 
XP_fromint(nbytes, z, -v); 
XP_neg(nbytes, z, z, 1); 

} else 
XP_fromint(nbytes, z, v); 

z[nbytes-1] &= msb; 


BJ MET AARMA: z 设 置 为 v 的 绝对 值 ， 然 后 将 1 作为 第 四 个 参数 传递 给 XP_neg ， 将 z 设 
成 它 的 一 进 制 补 码 ，MP_fromint 必 须 专 门 处 理 值 最 小 的 那个 整数 ， 内 为 它 不 能 取 反 。 如 果 v 
为 负 ，z 的 最 高 有 效 位 将 是 ! ， 而 且 必 须 舍 齐 额 外 的 位 。 许 多 MP 函数 前 习 惯 使 用 上 面 显 示 的 
z[nbytes-1] 全 =msb 语 名 含 弃 z 中 超出 最 高 有 效 字 节 的 那些 位 。 

对 十 MP_fromint，nbits 小 于 长 整数 的 位 数 日 v 超 出 了 z 的 范围 时 ， 会 产生 有 符号 洲 出 。 

(v is too big 377)= 


(nbits < 8*(int)sizeof (v) && 
(v < -Ct<<(nbits-1)) || v >= (1L<<(nbits-1)))) 
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RW 4- Ee SERRE AT Eie Aden f KAIT TER 
19.3.1 转换 


377 MP_toint 利 MP_cyt 介 绍 了 检查 有 符 oui H 5 NIS: 


(functions 37443= 
Jong MP toint(T x) { 
unsigned char d[sizeof (unsigned long)]; 


assert(x); 

MP_cvt(8*sizeof d, d, x); 

return XP_toint(sizeof d, d); 
了 


如 条 d 不 能 容纳 x ，MP_cvt 就 会 产生 MP_Overflow ; 如 果 d 可 以 容纳 x，XP_toint 返 回 期 望 值 。 
MP_cvt 完 成 鸯 种 转换 : 把 -个 MP_T 转 换 成 位 数 梢 多 或 稍 少 的 男 -个 MP_T。 


(functions 374)+= 
T MP.cvt(int m, Tz, T x) í 
int fill, i, mbytes = (m - 1)/8 + 1; 


assert(m > 1); 
(checked runtime errors for unary functions 378) 
fill = sign(x) ? OxFF : 0; 
if (m < nbits) í 
(narrow signed x 379) 
) else f 
(widen signed x 379) 
H 


return z; 


} 
(checked runtime errors for unary functions 378)= 
assert(x); assert(z); 
Anam P Fnbits ，MP_cvt 就 “缩小 ”x 的 值 并 将 此 赋予 z。 这 种 情 沈 必须 检查 在 符 导游 出 。 如 
果 x 中 mm 位 到 nbits-1 位 郁 尽 0 或 都 足 I， 也 就 是 并、 如 果 将 x 作为 -个 m 位 整数 处 理 的 时 候 ，x 
中 超出 的 位 部 等 于 x 的 符号 位 ,m 位 就 适合 x。 下面 的 程序 块 小 ， 如 果 x 为 负 或 堆 ， AUG AFF, 
[578] 因此 如 果 人 xfm..nbits-1] 都 是 1 或 都 是 0 ,. x[i]^fill 应 为 0 。 





(narrow signed x 379)= 
int carry = (x[mbytes-1]^fiT1)&-ones(m ; 
for (i = mbytes; i « nbytes; i++) 
carry |= x[i]Afill; 
memcpy(z, x, mbytes); 
z[mbytes-1] &= ones(m); 
if (carry) 
RAISE(MP_Overflow); 


如 县 处 于 范围 内 ，carry 将 为 9， 否则 ，carry 的 - 





些 位 将 为 !，carry 的 初始 值 忽 略 了 将 成 为 z 
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9 部 分 非 符号 位 的 耶 些 位 - 
如 果 m 至 少 为 nbits ，MP_cYt“ 扩 大 ”x 的 值 并 将 它 赋 子 z-。 这 种 情况 不 会 产生 溢出 FUR 
MP_cvt 必 须 传递 由 各 ] 给 出 的 x 符 号 位。 


(widen signed x 379)= 
memcpy(z, x, nbytes); 
z[nbytes-1] [= fill&-msb; 
for (i = nbytes; i < mbytes; i++) 
z[i] = fill; 
z[mbytes-1] &- ones(m); 


MP_tointu 使 用 了 类 似 的 方法 ; 它 调用 MP_cvtu 把 x 转换 成 一 个 具有 无 符号 长 整 型 整数 位 
数 的 MP_T， 然 后 调用 XP_toint 返 回 这 个 值 。 


(functions 3744 
unsigned long MP tointu(T x) í 
unsigned char d[sizeof (unsigned long)]; 


assert(x); 

MP cvtu(8*sizeof d, d, x); 

return XP_toint(sizeof d, d); 
} 


同样 MP. cvtusi/ soft D Ax IS. ThE Let pz, 


(functions 3744 
T MP. cvtu(int m, Tz, T x) { 
int i, mbytes = (m - 1)/8 + 1; 


assert(m » 1); 
(checked runtime errors for unary functions 378) 
if (m « nbits) { 
(narrow unsigned x 380) 
} else { 
(widen unsigned x 380) 
} 
return z; 


Y 


亚 小 于 nbits 时 ， 如 果 x 中 四 到 Dbits-1 位 中 内 任 一 位 为 ] 则 产生 溢出 ， 这 是 由 与 MP_cvt 中 代码 类 
似 、 但 相 比 起 来 更 简单 一 些 的 代码 进行 核验 检查 的 。 


(narrow unsigned x 380)= 
int carry = x[mbytes-1]&-ones(m); 
for (i = mbytes; i « nbytes; i44) 
carry l= x[i]; 
memcpy(z, x, mbytes); 
z[mbytes-1] &- ones(m); 
(test for unsigned overflow 376) 


mÁ-TSTnbisWW @ pe ENH, Tz es iH a ESO: 





i79] 
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(widen unsigned x 380) 
memcpy(z, x, nbytes); 
for G nbytes; i « mbytes; i++) 
z[i] 20; 





19.832 无 符号 算法 


EAR MP evt AMP evt RRA, EE HARRIN EI AREETA 
现 ， 因 为 它们 不 需要 处 理 符号 ， 作 了 由 溢出 检测 也 更 简单 。 无 符号 加 法 说 明了 一 种 简单 情况 ; 
[s80] XP_add 完 成 了 所 有 的 工作 ， 
(functions 374)+= 


T MP_addu(T z, Tx, Ty) í 
int carry; 





(checked runtime errors for binary functions 381) 
carry = XP add(nbytes, z, x, y, 0); 
carry |= z[nbytes-1]&-msb; 

z[nbytes-1] &- msb; 

(test for unsigned overflow 376) 

return z; 


H 


(checked runtime errors for binary functions 381) 
assert(x); assert(y); assert(z); 


减法 也 一 样 的 容易 [EEE KAP B borrow & 4| E MP. Overflow: 


(functions 374) 
T MP_subu(T z, Tx, Ty) ( 
int borrow; 


(checked runtime errors for binary functions 381) 
borrow = XP. sub(nbytes, z, x, y, 0); 
borrow |= z[nbytes-1]&-msb; 

z[nbytes-1] &- msb; 

(test for unsigned underflow 381) 

return z; 


H 


(test for unsigned underflow 381)= 
if (borrow) 
RAISE(MP. Overflow); 


MP. mul2u fe (855 RE E e. DS IA 


(functions 374)+= 
T MPLmut2u(T z, T x, Ty) ( 
(checked runtime errors for binary functions 38; 
memset(tmp[3], 'NO', 2*nbytes); 
XP mul(tmp[3], nbytes, x, nbytes, y); 
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memcpy(z, tmp[3], (2*nbits - 1)/8 + 1); 
return z; 


} 
MP. mul2u it 9-24 S38 FA WR Ftmp(3], Jfietmp[3] & wl Fiz, iX Rex Xy SB AT Ez. an ek 
MP_mul2u 将 计算 的 结果 直接 赋 子 z， 这 样 就 不 起 作用 在 MP_set 中 分 配 临 入 空间 不 仪 将 
分 配 隔 离开 米 ， 也 避免 了 x 与 y 的 限制 
MP. mul 出 调 内 XP_mul 计 算 tmpl3] 中 的 双 售 长度 结 果 ， 然 后 把 郁 个 结果 缩小 成 nbits ， 并 
Rz. 


(functions 3744 
T MP_mulu(T z, Tx. T y) í 

(checked runtime errors for binary functions 381) 
memset(tmp[3], 'X0', 2*nbytes); 
XP_mul(tmp[3], nbytes, x, nbytes, y); 
memcpy(z, tmp[3], nbytes); 
z[nbytes-1] &- msb; 
(test for unsigned multiplication overflow 382) 
return z; 


H 
如 果 tmp[3] 中 的 nbits 到 2，nbits-] 位 是 1 乘积 就 会 谥 出 ， 采 出 检测 MP_cvtu 中 类 似 条 件 的 方法 
就 可 以 检测 这 种 情况 ; 
(test for unsigned multiplication overflow 382)= 


int i; 
if (tmp[3][nbytes-1]&-msb) 
RAISE(MP_Overflow); 
for G = 0; i < nbytes; i++) 
if (tmp[3][itnbytes] != 0) 
RAISE(MP. Overflow); 
了 


MP_divu 将 y 复 制 到 临时 空间 ， 从 而 避免 【XP_div 对 其 参数 的 限制 


(functions 374)+= 
T MP_divu(T z, Tx, T y) í 
(checked runtime errors for binary functions 381) 
(copy y to a temporary 383) 
if C!XP_div(nbytes, z, x, nbytes, y, tmp[2], tmp[3])) 
RAISE(MP_Dividebyzero); 
return z; 


1 
(copy y to a temporary 383)= 
memcpy(tmp[1], y. nbytes); 


y = tmp[1]; 
} 


tmp[2] 保 在 舍弃 的 余数 ，tmptI1 Ry. Ey TATA tmp D]. tnp[3] EXP. div frg 85 








382 
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280 HIVE 





2 nbyte +2 位 临时 空间 。MP_modu 非 常 相 做 ， 只 是 它 用 tmp[2] 保 企 商 值 :; 


(functions 374)+= 
T MP_modu(T z, T x, T y) { 
(checked runtime errors for binary functions 381) 
(copy y to a temporary 383) 
if (!XP_div(nbytes, tmp[2], x, nbytes, y, z, tmp[3])) 
RAISE(MP_Dividebyzero); 
return z; 


} 
193.3 有 符号 算法 


AP 的 有 符号 数值 表示 使 AP_add 必 须 状 虑 x 和 y 的 符 全 ， 二 进 制 补 僻 表 相 法 的 特性 允许 
MP_add 避 免 这 种 分 析 ，Iij 且 仪 仅 调用 XP_add 而 不 管 x 和 ly 的 符号 。 内 而 ， 有 符号 加 法 几乎 与 
无 符号 加 法 E. H- RU EY SES a Fd 


(functions 374)+= 
T MP_add(T z, Tx, T y) í 

int sx, sy; 
(checked runtime errors for binary functions 381) 
5X = sign(x); 
sy = signty); 
XP_add(nbytes, z, x, y, 0); 
z[nbytes-1] & msb; 
(test for signed overflow 384) 
return z; 


} 
加 法 中 x 和 y 符 号 相同 时 产生 溢出 ， 当 和 溢出 时 ， 它 的 符号 不 同 于 x 和 y 的 符 导 : 


(test for signed overfiow 384)= 
if (sx == sy && sy != sign(z)) 
RAISE(MP. Overflow); 


有 符号 减法 与 加 法 形式 相同 ， 但 是 溢出 的 检测 不 同 。 


(functions 374)+= 
T MP_sub(T z, Tx, T y) í 
int sx, sy; 





(checked runtime errors for binary functions 381) 
SX = sign(x); 

sy = sign(y); 

xP_sub(nbytes, z, x, y, 0): 

z[nbytes-1] &- msb; 

(test for signed underflow 384) 

return 2; 


了 
对 于 减法 , x 和 y 的 符 导 不 同时 发 后 溢出 。x 为 正明 y 为 负 时 ， 结 果 应 为 正 ; x A Ry Ey, 
FRAT. PL. MAY APSA, COR Ly APS ARI), AE FR. 
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(test for signed underflow 384)= 
if (sx != sy && sy == sign(z)) 
RAISE(MP. Overflow); 


SEO RAST MOm EX. DUX ATA PETS Hi En so OUO EL SACRE IA AA 


(functions 374)+= 
T MP. neg(CT z, T x) { 
int sx; 


(checked runtime errors for unary functions 378) 
sx = signOO ; 
XP.neg(nbytes, z, x, 1); 
z[nbytes-1] &- msb; 
if (sx && sx == sign(z) 
RAISE(MP. Overflow); 
return 2; 


} 


MP_neg n BER E s GIST B TKS, Lx Akad, CLB. 


KRAIT SERE VERG Bof IT RE OPE BL, 执行- 个 AAT ORR. PRR BE AR 
同时 再 将 结果 取 反 。 对 十 MP mul2, h PEAS EAS aS Ser "ii l, 


而 朋 很 容易 填写 细节 ; 


(functions 374)+= 
T MP_mul2(T z, Tx, Ty) { 
int sx, sy; 


(checked runtime errors for binary functions 381) 
(tmp[3] e x: y 385) 
if (sx != sy) 

XP.neg((2*nhits - 1)/8 + 1, z, tmp[3], 1); 
else 

memcpy(z, tmp[3], (2*nbits - 1)/8 + 1); 
return z; 


了 


《tmp[3] — x- y 385)= 
sx = sign(x); 
sy = sign(y); 
Gf x < 0, negate x 386) 
(if y < 0, negate y 386) 
memset(tmp[3], 'NO', 2*nbytes); 
XP-mul(tmp[3], nbytes, x, nbytes, y); 


乘积 具有 2 «nbitsfz, 1 
取 反 值 ， 于 重新 指向 x 或 y ， 以 实现 x 和 y 取 反 





Qf x < 0, negate x 386)= 
if (sx) { 
XP-neg(nbytes, tmp[0], x, 1); 
x = tnp[0]; 


KZO - nbits-1)/8«1 7 35, DS BAY P RE (El TAS B] E Ax Mly 的 
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386 








x[nbytes-1] &- msb; 
} 


Gf y < 0, negate y 386)= 
if (sy) { 
XP_neg(nbytes, tmp[1], y, 1); 
y = tmp[1]; 
y[nbytes-1] &= msb; 


通常 ， 必 要 的 时 候 调用 MP RR Ex lya RA H, JR #EfEtmp[0] #tmp[1] 中 
MP_mul 类 似 填 MP_mul2 ， 只 是 仅 持 页 2 .nbit 位 结果 中 最 低 有 效 nbits 做 ， 而 且 ， 结 果 不 
能 够 放 人 nbits 位 ， 或 者 操作 数 符号 相同 症结 果 为 负 时 ， 会 发 生 溢出 ， 


(functions 374)+= 
T MPmul(T z, Tx, T y) { 
int sx, sy; 


(checked runtime errors for binary functions 381) 
(tmp[3] — x: y 385) 
if (sx != sy) 

XP_neg(nbytes, z, tmp[3], 1); 
else 

memcpy(z, tmp[3], nbytes); 
z[nbytes-1] &= msb; 
(test for unsigned multiplication overflow 382) 
if (sx == sy && sign(z)) 

RAISE(MP Overflow); 
return z; 


H 
操作 数 符号 相同 时 有 符号 除法 与 无 符号 除法 非常 相像 ， 内 为 它们 的 商 和 余数 都 非 抽 。 仅 
当 被 除数 屁 最 小 的 p 位 负数 且 除 数 为 -1 时 产生 溢出 ; 这 种 情况 下 ， 商 为 负 。 


(functions 374) 
TMPdivTz, Tx, Ty) { 
int sx, sy; 


(checked runtime errors for binary functions 381) 
sx = sign(x); 
sy = sign(y); 
(if x < 0, negate x 386) 
Gf y « 0, negate y 386) else (copy y to a temporary 383) 
if CIXP div(nbytes, z, x, nbytes, y, tmp[2], tmp[3])) 
RAISE (MP_Dividebyzera); 
if (sx != sy) { 
(adjust the quotient 388) 
} else if (sx && sign(z)) 
RAISE(MP. Overflow); 
return z; 
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MP_diy 会 将 y 取 反 置 人 临 时 空间 ， 或 者 将 y 复 制 到 那里 ， 央 为 ?和 z 可 能 是 禁 同 的 MP_T， 而 且 
用 tmp[2] 保 存 余数 ， 
操作 数 符号 不 同时 有 有 符号 除法 和 取 余 会 复杂 一 些 . 这 种 情况 下 ， 商 为 负 , 但 必须 如 向 于 
负 无 窃 截 取 , 时 余 数 为 于。 所 需 的 调整 与 AP_div 和 AP_mod 相 同 : HRE, LURR RES 
Jub. WIE. WREN SREE, yR ERREZ EE it 
(adjust the quotient 388)= 
XP_neg(nbytes, z, z, 1); 
if (!iszero(tmp[2])) 


XP_diff(nbytes, z, z, 1); 
z[nbytes-1] &= msb; 






(macros 374)+= 
#define iszero(x) (XP_length(nbytes, Gd)==1 && (x) [0]==0) 


由 于 MP_diy 含 齐 了 余数 ， 内 此 它 不 影响 余数 的 调整 。MP_mod 恰 好 相反 : 它 仅 调整 余数 ， 并 
用 tmp[2] 保 存 余数 。 


(functions 37449 
T MP_mod(T z, Tx, Ty) í 
int sx, sy; 


(checked runtime errors for binary functions 381) 
sx = signOO; 
sy = signty); 
(if x < 0, negate x 386) 
(ify < 0, negate y 386) else (copy y to a temporary 383) 
if CIXP.div(nbytes, tmp[2], x, nbytes, y, z, tmp[3])) 
RAISE(MP Dividebyzero) ; 
if (sx != sy) í 
if Cliszero{z)) 
XPLsub(nbytes, z, y, z, 0); 
} else if (sx && sign(tmp[2])) 
RAISE(MP_Overflow); 
return z; 


) 
19.3.4 简易 函数 


算术 简易 函数 接收 - -个 长 整 型 或 无 无 符号 长 整 开 直接 操作 数 ， 根 据 需要 将 其 转换 成 一 个 
MP_T， 并 执行 由 应 算法 操作 ，y 是 以 2* 为 底数 的 一 位 数 . 这 些 丙 数 串 以 使 用 XP 导出 的 一 位 
数 函数 。 但 旦 有 两 种 情况 会 产生 溢出 : y KAAK R RA hih WYRA. ce ñas ps 
顷 在 引发 异常 之 前 定 成 操作 太 z 的 赋值 。 MP_addui 描 述 了 所 有 简易 晒 数 所 使 用 的 这 种 方法 : 






(functions 374)+= 
T MP_addui(T z, T x, unsigned long y) { 
(checked runtime errors for unary functions 378) 
if (y < BASE) { 








387 














388 
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int carry = XP. sum(nbytes, z, x, y); 
carry |= z[nbytes-1]&-msb; 
z[nbytes-1] &« msb; 
(test for unsigned overflow 376) 

) else if (applyu(MP addu, z, x, y)) 
RAISE(MP Overflow); 

return z; 


} 


(macros 374)+= 
#define BASE (1««8) 


fu Ey 是 -位 数 ，XP_sum 可 以 计算 f+y .nbits 小 于 8 Ay ACK E EH CIUS 236 EB. IS 
对 任 - 习 总 和 部 会 太 大 。 洛 则 ，MP_addui 调 用 applyu 将 y 和 转换 成 MP_T 、 并 应 用 更 常 几 的 函数 
MP. addu. Wy A. applyuiE I — P1, (UL ZEE ZAG: 


(static functions 389)« 
static int applyu(T op(T, T, T), Tz, T x, 
unsigned long u) { 
unsigned long carry; 


Í T z = tmp[2]; (setz tou 376) } 
op(z, x, tmp[2]); 
return carry != 0; 


} 
appIyu 使 用 MP_fromintu 的 代码 转换 这 个 无 符 叶 长 整 型 操作 、 并 放 入 tmp[2] ， 它 还 保存 
转换 中 的 carry ， 央 为 转换 可 能 会 溢出 ,然后 调用 它 第 一 BUG MPR: 而且， some 
的 carry 非 零 、 则 返回 1 AME WO. ee Heop dir SUR Rel. Ath DOE BEPEEZIG 
FORE CBU RR EUR I. ECCE AB DL. y 小 十 2 时 ，MP_subui 调 用 MP_oiff， 


(functions 381) 
T MP_subui(T z, T x, unsigned long y) { 
(checked runtime errors for unary functions 381) 
if Cy « BASE) { 
int borrow = XP.diff(nbytes, z, x, y); 
borrow |= z[nbytes-1]&-msb; 
z[nbytes-1] &- msb; 
(test for unsigned underflow 381) 

} else if Capplyu(MP_subu, z, x, yd) 
RAISE (MP_Over flow) ; 

return z; 








) 
如 果 y 太 大 ， 不 管 x 为 何 值 x-y AT, AEMP subuk HXP iff Z RIA Ray BEAK, 
MP muluijjfEMP product, #HZEnbits \48AMP_mului 必须 显 式 检查 y 是 否 太 大 ， 因 为 
x 为 零 时 XP_product 不 会 搞 提 财 个 银 误 、 这 个 答 查 也 足 在 计算 完 z 之 后 执行 蕉 


T MP_mului(T z, T x, unsigned long y) í 
(checked runtime errors for unary functions 381) 
if (y < BASE) { 
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int carry = XP_product(nbytes, z, x, y); 
carry |= z[nbytes-1]&-msb; 
z[nbytes-1] &- msb; 
(test for unsigned overflow 376) 
(check if unsigned y is too big 390) 

} else if Capplyu(MP. mulu, z, x, y)) 
RAISE(MP Overflow); 

return z; 


} 


(check if unsigned y is too big 390)= 
if (nbits < 8 && y >= (1U««nbits)) 
RAISE(MP_Overflow) ; 390 


MP_divuifiMP_modui fA XP quotient. (LH Ci) OBOE HE (因为 
XP. quotient 514% RIE SA — GR AC), iii Fnbits 7) T-8 Ly KAKETE fl HERI ym b . 

















(functions 381)+= 
T MP_divui(T z, T x, unsigned long y) í 

(checked runtime errors for unary functions 381) 

if (y == 0 
RAISE(MP_Dividebyzero); 

else if (y < BASE) { 
XP_quotient(nbytes, z, x, y); 
(check if unsigned y is too big 390) 

} else if (applyu(MP divu, z, x, y)) 
RAISE(MP. Overflow); 

return z; 


} 
MP_modui 油 用 XP_quotient ， 伺 足 仪 用 以 计算 余数 。 它 含 蛮 保存 在 tmp[2] 中 的 余数 ; 


(functions 381)+= 
unsigned long MP modui(T x, unsigned long y) { 
assert(x); 
if (y == 0) 
RAISE(MP. Dividebyzero); 
eise if (y < BASE) 1 
int r - XP. quotient(nbytes, tmp(2], x, y); 
(check if unsigned y is too big 390) 
return r; 
} else if (applyu(MP. modu, tmp[2], x, y)) 
RAISE(MP. Overflow); 
return XP toint(nbytes, tmp[2]); 
} 


有 符号 算法 简易 两 数 使 用 相同 的 方法 ， 但 是 调用 不 同 的 apply 函数 ， 这 个 函数 使 用 
MP- 人 omint 代 码 将 tmp[2] 由 的 长 整数 转换 成 有 符号 MP_T， 还 调用 期 单 函 数 ， 而 且 ， 如 果 直 
接 操作 数 太 大 则 返回 1 ， 否 则 返回 0。 [591] 





(static functions 3894 
static int applyC(T op(T, T, D, T z, T x, long v) í 
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392 








{ T z = tmp[2]; (setz tov 377) Y 
op(z, x, tmp[2D; 
return (v is too big 377); 


H 
ly E258], A EU SLE BR RE OG MORS TIFE E IL DERE aS I Ba CER E A, 
FODE AT ban As FEE EBR. -XP RS BU HEC. 因此 有 符号 简易 
BA VWE TT ER fE 3 80 PER RE LP RC LOI DEDE UT AP Bñ 3 B A 287 
(参见 前 面相 关 章节 ), BEMPT BE AREA AERE OY, TR RR IRIURE 





| y<0 y20 
x<O f -xl +D = XM -MD = x «d 
x20 xl- =x- X Ixl + lyi = x+ |y] 


y 为 负 时 ,对 任意 x ，x+y 都 等 于 x-yl， 因 此 MP_addi 可 以 使 用 XP_diff 计 算 总 和 ; y 非 负 时 可 
以 使 用 XP_sum . 


(functions 381) 
T MP_addi(T z, T x, Yong y) { 
(checked runtime errors for unary functions 381) 
if (-BASE < y && y < BASE) í 
int sx = sign(x), sy = y < 0; 
if (sy) 
XP_diff(nbytes, z, x, -y); 
else 
XP_sum (nbytes, z, x, y); 
z[nbytes-1] &= msb; 
(test for signed overflow 384) 
(check if signed y is too big 393) 
} else if Capply(MP_add, z, x, y)) 
RAISE(MP_Overflow); 
return z; 
} 
(check if signed y is too big 393)= 
if (nbits < 8 
&& (y < -(1<<(nbits-1)) [| y >= (1««(nbits-21)))) 
RAISE(MP. Overflow); 


有 符号 减法 的 情形 与 加 法 正好 相反 〈 参见 前 面 章节 AP_sub 分 析 ): 
| y<0 y>0 


x<0 | b = «b -lx + DD) = x- I4 
MI+M=xzD p- =x- 





因此 ，y 为 负 时 MP_subi 调 用 XP_sum 将 ly! 与 x 相 加 ，y 非 负 时 调用 XP_diff、 


(functions 381) 
T MP-subi(T z, T x, long y) { 
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(checked runtime errors for unary functions 381) 
if (-BASE < y && y < BASE) í 
int sx = sign(x), sy = y < 0; 
if (sy) 
XP.sum (nbytes, z, x, -y); 
else 
XP.diff(nbytes, z, x, y); 
z[nbytes-1] &= msb; 
(test for signed underflow 384) 
(check if signed y is too big 393) 
} else if (apply(MP_sub, z, x, y)) 
RAISE(MP_Overflow); 
return z; 


} 
MP_muli 使 用 MP_mul 的 策略 : 它 将 负 的 操作 数 取 反 ， 调 用 XP_product 计 算 乘 积 ， 而 用 
如 果 操 作 数 符号 不 同 还 要 将 乘积 取 反 。 


(functions 381)+= 
T MP_muli(T z, T x, long y) { 
(checked runtime errors for unary functions 381) 
if (-BASE < y && y < BASE) { 
int sx = sign(x), sy = y < 0; 
Gf x < 0, negate x 386) 
xP_product(nbytes, z, x, sy ? -y : y); 
if (sx != sy) 
XP_neg(nbytes, z, x, 1); 
z[nbytes-1] &- msb; 
if (sx == sy && sign(z)) 
RAISE(MP Overflow); 
(check if signed y is too big 393) 
} else if Capply(MP mul, z, x, y)) 
RAISE(MP. Overflow); 
return z; 


} 
MP_divi 和 MP_modi 必 但 除数 是 桔 为 零 ， 因 为 它们 调用 XP_quotient 计 算 商 和 余数 。 


MP_divi 合 弃 余 数 ， 而 MP_modi 含 从 商 : 


(functionsH= 
T MP_divi(T z, T x, long y) { 

(checked runtime errors for unary functions 381) 

if (y == 0) 
RAISE(MP Dividebyzero); 

else if (-BASE « y && y « BASE) { 
int r; 
(z — XY, r — x mod y 395) 
(check if signed y is too big 393) 

} else if (apply(MP div, z, x, y)) 
RAISE(MP. Overflow): 

return z; 











393 
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long MP_modi(T x, long y) í 
assert(x); 
if (y = 0) 
RAISE(MP_Dividebyzero); 
else if (-BASE < y && y < BASE) { 
T z = tmp[2]; 
int r; 








394 (z & xiy, r — x mod y 395) 
(check if signed y is too big 393) 
return r; 
} else if Capply(MP_mod, tmp[2], x, y)) 
RAISE(MP_Overflow); 
return MP_toint(tmp[2]); 
} 
MP_modiia/HMP_toint ñi EXP_toint AIA ¿E fF GR 1-8 IE ， 
MP_divi 和 MP_modi 共 有 的 代码 块 计算 商 和 余数 ， 并 在 5 和 y 符 号 不 同 且 余数 非 零 时 凋 整 
商 和 余数 - 
(z — wiy, r — x mod y 395)= 
int sx = sign(x), sy = y < 0; 
(if x < 0, negate x 386) 
r = XP_quotient(nbytes, z, x, sy ? -y : y); 
if (sx != sy) { 
XP_neg(nbytes, z, z, 1); 
if (r != O) { 
XP. diff(nbytes, z, z, 1); 
r-y-n 
H 
z[nbytes-1] &- msb; 
1 else if (sx && sign(z)) 
RAISE(MP Overflow); 
19.8.5 [ig ATE SEHR E 
无 符号 比较 很 容易 一 MP_cmp 就 可 以 调用 XP_cmp : 
(functions 381)+= 
int MP_cmpu(T x, T y) í 
assert(x); 
assert(y); 
return XP_cmp(nbytes, x, y); 
} 
395) x 和 7 符号 不 同时 ，MP_cmp(x, y) 仪 返回 y jx B4 G-2: 9: 








(functions 381)+= 
int MP_cmp(T x, T y) í 
int sx, sy; 


assert(x); 
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assert(y); 
sx = sign(x); 
sy = sign(y); 


if (sx l= sy) 
return sy - sx; 
else 
return XP_cmp(nbytes, x, y); 


} 
X 和 y 符 切 相 同时 ，MP_cmp 可 以 把 它们 作为 无 符号 数 处 坏 ， 然 盯 调 用 XP_cmp 进 行 比较 。 
比较 简易 两 数 不 能 使 用 applyu 和 apply .内 为 它们 计算 整数 结果 、 而 且 它 们 并 不 要 求 它们 
的 长 整 起 和 励 符 忆 长 整 型 操作 数 匹 卫 MP_T.。 这 些 函 数 仅 仪 是 将 MP_T 与 .个 立即 数 进行 比 
Ri 这 个 值 太 大 时 ， 就 会 反映 在 比较 结果 中 一 个 克 符 号 长 改 数 的 位 数 至 少 为 nbits 时 。 
MP_cmpui 就 把 MP_T 和 转换 成 -个 无 符 恕 政 数 ， 并 使 用 通常 的 C 比 较 函 数 。 而 则 ， 它 就 把 立即 
数 转换 为 MP_T 保 在 在 tmp[2] 小 、 然 后 出 用 XP_cmp 


(functions 381)+= 
int MP_cmpui(T x, unsigned long y) { 

assert(x); 

if CCint)sizeof y >= nbytes) í 
unsigned long v = XP_toint(nbytes, x); 
(return -1, O, «T, ifv <y, v 2 y, v » y 396) 

) else { 
XP. fromint(nbytes, tmp[2], y); 
return XP cmp(nbytes, x, tmp[2]); 


} 


(return -1,0, «T, ifv < y, v = y, v > y 396) 
if (v < y) 
return -1; 
else if (v > y) 
return 1; 
else 
return 0; 


MP_cmpui Wi HXP_fromint Z GA 82 TER iB. ESSE 1-8 FE GC Try BU T 8k FMP_T af 
执行 。 

X 和 y 符 号 不 同时 MP_cmpi 可 以 不 用 全 部 部 进行 比较 ， 它 采用 了 MP_cmpui 的 方法 : 如 果 
立即 数 的 位 数 不 少 于 MP_T ， 就 可 以 用 C 的 比较 函数 完成 比较 ， 

(functions 3744s 


int MP. cmpi(T x, long y) { 
int sx, sy = y «0; 


assert(x); 

5X = sign(x); 

if (sx f= sy) 
return sy - sx; 





IÈ 











397 
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else if (Cint)sizeof y >= nbytes) { 
long v = MP_toint(x); 
(return -1,0,+1, ify « y. vo y, v > y 396) 
) else { 
MP_fromint(tmp[2], y); 
return XP.cmp(nbytes, x, tmp[2]); 
3 
H 


X 和 y 符 号 相同 了 y 的 位 数 小 十 MP_T 时 、MP_ecmpi 可 以 安全 地 把 y 转 换 成 MP_T 并 你 存在 
tmp[2] 中 ， 然 后 谢 用 XP_cmnp 比较 x 和 tmp[2] MP. empi J]FEMP. fromint mA EXP. fromint t 
为 了 正确 处 理 负 值 的 y > 

二 进 制 四 辑 函数 一 -MP_and , MP. or &MP. xor 
BORA c TARE RIE URSI" T E DO ER fE- 


(macros 3744 
#define bitopCop) \ 
int i; assert(z); assert(x}; assert(y); Ñ 
for (i = 0; i < nbytes; i++) z[i] = x[i] op y[i]; \ 
return z 
(functions 3744 
T MP_and(T z, T x, T y) { bitop(&); } 
T MP_or (T z, T x, T y) í bitop(D; } 
T MP_xor(T 2, T x, T y) { bitop(A}; } 


MP nott i, EAR VU Rebitop Igi t: 





ALR AD SCHLRUMPIRER. AAR 


(functions 374)4= 
T MP_not(T z, T x) { 
int i; 


(checked runtime errors for unary functions 378) 
for (i = 0; i < nbytes; i++) 


z[i] = -x[i]; 
z[nbytes-1] &- msb; 
return z; 


} 
AANE SIT E eR BY BA THR RR | (RS LPR AT Et TAT ee pee Ay 
直接 操作 数 不 会 引发 异常 ,仍旧 可 以 使 用 applyu; 它 的 返回 值 就 被 忽略 不 计 6. 





(macros 3749 
#define bitopiCop) assert(z); assert(x); N 
applyuCop, z, x, y); N 
return z 


(functions 374)-= 
T MP_andi(T z, T x, unsigned long y) { bitopi(MP_and); } 
T MP-ori (T z, T x, unsigned long y) ( bitopi(MP or); ) 
T MP.xori(T z, T x, unsigned long y) ( bitopi(MP xor); Y 
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这 三 个 移 位 函数 先 执行 可 检查 的 运行 期 错误 ， 并 检查 s 人 于 或 等 于 abits 时 的 简单 情况 ， 
这 种 情况 下 ， 结 果 孝 是 0 小 部 是 1 ， 然 后 再 调用 XP_lshift 或 XP_rshift。XP_ashitt 用 1 进行 填 充 ， 
然后 实现 一 个 算术 在 移 。 


(macros 374)+= 
#define shft(fill, op) Ñ 
assert(x); assert(z); assert(s >= 0); \ 
if (s >= nbits) memset(z, fill, nbytes); X 
else op(nbytes, z, nbytes, x, s, fill); N 
z[nbytes-1] &- msb; N 
return z 


(functions 374)+= 
T MPLishift(T z, T x, int s) ( shft(0, XP shift); } 
T MP_rshift(T z, T x, int s) ( shft(0, XP rshift); } 
T MP ashift(T z, T x, int s) í shft(signOGO XP. rshift); } 


19.8.6 字符 中 转换 


最 后 四 个 函数 在 字符 串 和 MP_T 之 间 进 行 转换 . MP_fromastr 很 像 strtoul， 它 把 字符 中 解 
释 成 底数 在 2 到 36 之 问 的 个 元 符号 数 。 字 和 母 才 示 底数 大 于 10 时 的 9 以 上 数字 。 


(functions 374)+= 
T MP_fromstr(T z, const char *str, int base, char **end)( 
int carry; 


assert(z); 

memset(z, '\O', nbytes); 

carry = XP fromstr(nbytes, z, str, base, end); 
carry [= z[nbytes-1]&-msb; 

z[nbytes-1] &- msb; 

(test for unsigned overflow 376) 

return z; 


} 
XP_fromstr AFR MEK, THA. dl Rend sk AMAL end Vr RMSE L FEIE DIE 1-749 th 
址 。 由 于 XP_fromint 把 转换 得 到 的 值 添加 到 z ， 内 此 z 被 初始 化 为 零 。 
MP_tostr 完 成 相反 的 转 措 ， 它 接收 一 个 MP_T， 并 将 MP_T 值 表示 成 以 2 到 36 之 间 的 数 为 
底数 的 字符 串 形式 ， 用 以 韧 充 一 个 字符 囊 . 
(functions 374)+= 
char *MP tostr(char *str, int size, int base, T x) { 


assert(x); 
assert(base >= 2 && base <= 36); 
assert(str == NULL || size > 1); 


if (str == NULL) [í 
(size — number of characters to represent x in base 400) 
str = ALLOC(size); 
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memcpy(tmp[1], x, nbytes); 
XP.tostr(str, size, base, nbytes, tmp[1]); 
return str; 


} 
如 果 str ye, MP tostr RAM MEERA TE Rex Dl base 为 底数 的 表示 形式 、 
MP_tostr 使 用 AP_tostr 的 技巧 计算 这 个 字符 趾 的 大 小 : sr £p AUR [nbitsk] 个 字符 ， 这 里 
k 要 使 2 是 小 于 或 等 于 base 的 两 个 值 中 的 最 大 指数 〈 人 参见 第 18 ETAREN RAR), M 
且 出 于 终止 空 字符 的 存在 还 要 加 1。 


(size e number of characters to represent x in base 400)= 


t 
int k; 
for (k = 5; (1<<k) > base; k--) 
size = nbits/k + 1 + 1; 

} 


Fmt 样 式 的 转换 函数 格式 化 无 符号 或 有 符号 MP.T。 每 个 函数 者 需要 两 个 参数 ， 一 个 
MP_T 和 一 个 位 于 2 到 36 之 间 的 底数 。MP_fmtu 调 用 MP_tostr 转 换 它 的 MP_T， 并 调用 
Fmt_putd 林 印 转 换 结 果 。 回 调 Fmit_putd 以 printf 的 %d 转 换 方式 打印 数值 > 


(functions 374}H= 
void MP fmtu(int code, va list *app, 
int put(int c, void *cl), void "cT, 
unsigned char flags[], int width, int precision) { 
Tx; 
char *buf; 


assert(app && flags); 

x = va arg(*app, D; 

assert(x); 

buf = MP. tostr(NULL, 0, va arg(*app, int), x); 

Fmt_putd(buf, strlen(buf), put, cl, flags, 
width, precision); 

FREE (buf); 

} 


MP_fmt 要 完成 的 工作 稍 多 一 点 、 因 为 它 把 MP_T 解 释 成 - 8 PSK, EMP tostr Hik 
受 无 符号 MP_T。 内 而 ，MP_fmt 自 己 分 配 缓冲 区 ， 这 样 如 果 需 归 的 话 它 就 能 包含 -个 前 导 符号 。 


(functions 374)H= 
void MP fmt(int code, va list *app, 
int put(int c, void *cl), void *cl, 
unsigned char flags[], int width, int precision) { 
x; 
int base, size, sx; 
char *buf; 


assert(app && flags); 
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x = va_arg(*app, T); 
assert(x); 
base = va_arg(*app, int); 
assert(base >= 2 && base <= 36); 
sx = sign(x); 
Uf x < 0, negate x 386) 
(size — number of characters to represent x in base 400) 
buf = ALLOC(size+1); 
if (sx) € 
buf [0] = '-'; 
MP_tostr(buf + 1, size, base, x); 
} else 
MP.tostr(buf, size + 1, base, x); 
Fmt_putd(buf, strlen(buf), put, cl, flags, 
width, precision); 


FREE 人 《buf) ; 
} 
参考 书目 浅 析 


多 精度 算法 经 常用 于 编译 器 ， 而 且 有 时 还 必须 使 用 。 例 如 ，Clinger (1990 ) 表明 ， 把 浮 
点 的 直接 量 转 换 成 相应 的 IEEE 浮 点 表示 法 有 时 需要 多 精度 算法 以 获取 最 佳 的 准确 度 。 

Schneier (1996 ) 是 关于 密码 学 的 -次 广泛 调查 。 此 书 非 常 实用 .而且 还 用 C 实 现 了 其 
中 一 些 算法 。 这 本 书 还 有 详尽 的 参考 书目 ， 对 继续 深入 调查 是 个 不 错 的 起 点 。 

止 如 第 17 章 乘法 一 节 内 容 所 居 ， 两 个 位 数 相 乘 需要 的 时间 与 n? 成 止 比 。Press et al. 
(1992 ) 中 的 20.6 节 介绍 了 如 何 使 用 快速 Fourier ( 傅立叶 ) 转换 在 与 n lgn 1g lgn 成 比例 的 时 
闻 内 实现 乘法 。 它 还 通过 计算 1/7 的 倒数 再 乘 以 x 实 现 了 xy- 这 种 方法 用 于 小 数 部 分 时 需要 
多 精度 数值 。 





练习 


19.1 当 nbits 是 8 的 售 数 时 ，MP 函 数 做 了 大 革 不 必要 的 工作 。 你 是 溃 能 够 修改 MP 的 实现 
避免 nbits mod 8 为 零 科 出 现 这 种 情况 ?实现 你 的 方案 并 估量 - -下 它 的 优点 或 代价 。 

192 对 许多 应 用 程序 而 育 ， 一 旦 选 好 nbits ， 就 不 得 改变 。 实 现 一 个 庆 牛 家 ,给 定 nbits 
的 某 个 值 ， 生 成 一 个 接 !1， 并 实现 nbits 位 算法 MP_nbits ， 其 他 与 MP 相同 * 

193 设计 并 实现 一 个 定点 多 精度 数 算法 的 接口 ， 也 就 是 说 ， 这 些 数 都 有 整数 部 分 和 小 
数 部 分 。 客 户 调用 程序 应 能 够 指定 数值 两 部 分 的 数字 。-- 定 要 指定 取 含 的 细节 ， 
Press et al. (1992) 20.6 节 涉及 了 这 道 习题 的 一 些 有 用 算法 。 

19.4 设计 并 实现 一 个 浮 点 数 算 法 的 搂 门 ， 其 中 客户 调用 程序 可 以 指定 指数 及 有 效 位 的 
位 数 ， 考 虑 这 道 题 之 前 疝 斌 一 Goldperg ( 1991 )。 

19.5 XP 和 MP 函数 没有 使 月 const 限 定 词 参数 ， 第 17 章 接口 - 节 中 详细 说 明了 其 中 原 内 。 
但 是 ，XP_T 和 MP_T 的 其 他 定义 可 以 正确 地 处 理 常 数 ， 例 如 indt dE. 
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typedef unsigned char T[]; 
“const T” 就 是 指 “ 无 符号 常 字符 型 前 数组 ”; 义 例如 ，MP._add 可 以 这 样 声 明 : 
unsigned char *MP_add(T z, const T x, const T y); 

在 MP_add 中 ,x 和 y 具 有 “指向 无 符号 常 值 宁 符 ”的 类 型 ， 因 为 形 参 中 的 数组 类 型 
“衰变 ”到 相应 的 指针 类 型 。 当 然 ， 常数 不能 防止 偶然 失真 ， 内 为 可 能 会 这 样 ， 比 
方 说 相同 的 数组 可 能 会 既 传 递 给 z 义 传递 给 x 。MP_add 的 这 个 声明 说 明了 把 T 定 义 
为 数组 类 型 的 “个 缺点 : T 不 能 用 作 和 返回 类 型 ， 疝 用 客户 调用 程序 不 能 声明 T 类 型 
的 变量 。 这 种 数组 类 型 仪 对 参数 有 用 。 将 T 定 义 为 nsigned char 的 typedef 可 以 避 
免 这 个 问题 : 

typedef unsigned char T; 

这 样 定义 ，MP_add 的 声明 就 可 以 是 

T *MP.add(T z[], const T x[], const T y[]); 

T *MP_add(T *z, T *x, T *y); 

中 的 任何 - RR 

使 用 这 两 种 T 的 定义 重新 实现 XP 及 其 客户 调用 程序 、AP 、MP 、 calc 及 mpcalc 、 再 
把 结果 的 可 读 性 与 原始 数据 进行 比较 。 








第 20 章 线 E 


一 般 的 C 程 序 痢 是 顺序 执行 程序 或 单线 程 程序 ， 即 程序 二 只 有 -条 控制 轨迹 。 出 程序 的 

单元 计数 器 给 出 每 条 指令 执行 时 的 地 址 。 大 多 数 情况 下 在 储 单元 都 足 顺序 向 前 移动 ， 一 次 一 
条 指令 。 单 元 计数 器 偶尔 会 内 跳 转 指令 或 湖 册 指令 而 迹 为 跳 转 的 日 的 位 置 或 被 调用 函数 的 地 

址 。 在 饼 单 元 计数 器 的 值 描绘 出 了 贯穿 程 序 的 一 条 描述 程序 扶 行 过 程 的 路 径 ; 这 条 路 径 看 上 
去 像 一 个 贯穿 程序 的 线程 。 

并 行 或 多 线程 程序 共有 多 个 线程 ,而且 最 -- 般 的 情况 下 ， 这 些 线程 都 足 同时 执行 的 ， 至 
少 理论 上 是 这 样 ， 正 是 并 行 执行 使 得 多 线程 应 用 称 序 的 编写 此 单线 程 应 用 程序 的 编写 更 加 人 复 
杂 ， 因 为 线程 相互 之 间 进 行 交互 时 其 有 潜在 的 不 确定 性 、 本 章 的 这 三 个 接口 导电 了 用 以 创建 
和 管理 线 称 、 同 步 协作 线程 的 行为 以 及 在 线程 之 间 进 行 通 信 的 晒 数 。 

对 于 其 有 并 行 行为 这 种 内 在 特性 的 应 用 程序 来 说 ， 线 释 非 常 有 玫 ， 图 形 用 户 接 1 
(graphical user interface, GUI) 是 个 最 好 的 例子 ; BAMA. RARE AA AOR Sas 
出 内 容 多 部 是 同时 进行 。 EERE RR, BRAUER Pe a DIA SD 
用 考虑 其 他 内 容 。 这 种 方法 有 助 于 简化 用 户 接口 的 实现 ,内 为 每 个 线程 都 可 以 像 且 “个 顺序 
程序 一样 来 设计 并 编 气 ， 除 非 它们 必须 与 其 他 线 称 通信 或 同步 

在 多 处 理 器 的 计算 机 上 ， 线 程 能 够 改进 那些 可 以 容易 地 分 解 成 相对 独立 子 任务 的 应 用 程 
序 的 性 能 。 每 个 子 任务 都 运行 任 单独 的 线程 中 ， 而 且 它 们 全 部 并 行 运行 ， 这 样 完成 起 来 就 比 
顺序 执行 这 些 于 任务 要 快 一 些 。20.2 闻 介绍 了 一 个 使 用 这 种 方法 的 排序 程序 

线程 对 构造 顺序 程序 也 有 帮助 ， 闪 为 它们 具有 状态 : 线程 包含 足够 的 相关 信息 ， 供 其 停 
正之 后 在 停 下 的 地 方 重新 开始 。 例 如 ， 典 型 的 UNIX C 编译 器 山 一 个 单独 的 预 处 理 程序 和 一 
个 汇编 程序 组 成 。 预 处 理 程序 读 取 源 代码 、 包 含 头 文件 、 扩展 宏 并 给 出 合成 的 源 代码 ;编译 
器 读 取 并 解析 展开 的 源 代码 ， 咎 成 代码 以 及 六- 编 语言 代 码 ; 汇编 程序 读 肥 汇编 语言 牛 成 日 标 
代码 。 这 些 过 程 通常 都 是 通过 谈 忆 临时 文件 相互 进行 通信 。 排 除 临 时 文件 以 及 污 、 写 和 删除 
这 些 文件 的 系统 开销 ， 使 用 线程 ， 每 个 阶段 都 可 以 作为 单个 应 用 程 订 旦 的 独立 线程 运行 。 编 
译 器 本 身 可 能 也 在 词法 分 析 器 和 解析 器 上 使 用 独立 的 线程 。20.2 节 用 计算 素数 的 一 个 管道 举 
例 说 明了 线程 的 这 种 用 法 。 

DARAN 这 会 限制 线程 的 效用 , 例如， 大 多 数 
UNIX 系 统 都 具有 阻塞 MO 原 语 ， 也 就 是 说 ， 当 一 个 线程 发 出 该 请 求 时 、 UNIX 进 程 及 其 所 有 
线程 都 在 等 待 这 个 请 求 的 完成 ， 在 这 些 BEN. BET AIO JE NIE S: BR. E 
号 处 理 也 非 党 类似。 大 多 数 UNIX 系 统 是 把 信号 和 信号 处 埋 器 uut 进程 关联 起 来 ， 而 不 足 与 进 
Tip RV SUE KK, 

线程 系统 支持 用 户 级 或 核心 级 的 线程， 或 首 两 种 郁 支 持 。 用 户 级 线程 完全 以 用 户 模式 实 
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M. SEG PRE ACH AE Db. MERKREDA RELEW EA; 伺 男 一 方面 ， 几 户 级 线 
程 的 作用 也 非常 大 。 下 一 节 的 Thread 接 口 介绍 了 用 户 级 线程 。 

核心 级 线程 使 用 操作 系统 工具 提供 服务 ， 例 如 ， 非 阻塞 O 和 每 线程 信号 处 理 。 较 新 的 
操作 系统 拥有 核心 级 的 线程 ， 并 使 用 这 些 线程 提供 线程 接口 ， 这 些 接口 的 - - 些 操作 需要 系统 
调用 ， 但 是 ,通常 这 样 会 比 用 户 级 线程 里 的 类 似 操 作 代 价 更 高 。 

即使 在 上 共有 核心 级 线程 的 系统 上 ， 标 准 库 林 能 不 是 可 再 次 进 人 或 者 安全 线程 的 。 一 个 可 
再 次 进入 的 函数 只 能 修改 局 部 变量 和 参数 。 修 收 企 局 变量 或 使 用 静态 变 基 来 保存 中 间 结 果 的 
PRUE AA) RU BEAT, 标准 C 库 中 一 些 医 数 的 典型 实现 就 是 不 可 上 再 次 进 人 的 。 如 果 同 时 激 
活 两 个 或 更 多 的 不 可 再 次 进入 函数 .它们 就 会 以 不 可 预知 的 方式 修改 这 些 中 间 值 。 在 单线 程 
程序 中 ， 出 于 直接 和 间接 的 递归 ， 可 以 同时 激活 多 个 函数 。 在 多 线程 程序 ':+， 因 为 不 同 的 线 
程 可 以 同时 济 用 同 -函数 ， 央 此 可 以 激活 多 个 函数 。 这 样 ， 同 时 调用 -个 不 可 再 次 进入 耳 数 
的 两 个 线程 会 修改 末 定 义 结 果 的 相同 存储 空间 。 

线程 安全 函数 使 用 同步 机 制 管理 共享 数据 的 访问 ， 并 内 而 可 以 或 者 不 可 青 次 进 人 。 这 种 
阴 数 可 由 多 个 线程 同时 调用 ， 而 不 用 考虑 同步 问题 . 这 样 多 线程 客户 调用 程序 使 用 起 米 就 更 
容易 一 些 ， 但 同时 也 产生 了 同步 的 代价 ， 即 使 是 对 单线 穆 客 户 调用 程序 。 

PR HEC ABER He of COT HEHE ABR AREKE, FILER EA aE 设想 最 坏 情况 ， 并 使 
用 同步 原 语 确 保 某 - .时 刻 仅 有 一 个 线程 在 执行 一 个 不 可 再 次 进 和 人 的 库 函 数 。 

本 书 中 的 大 多 数 函数 都 不 是 线程 安全 的 ， 但 是 可 再 次 进 人 - 47 ie PRA Text, map —RE db 
是 不 可 再 次 进入 的 ， 瑟 多 线程 客户 调用 程序 必须 调度 它们 自身 的 同步 问题 。 Bim, HURL 
线程 共享 一 个 Table T， 它 们 必须 侈 保 每 次 只 有 其 中 一 个 在 调用 Table 接 11 中 具有 Table_T 的 
函数 ， 就 像 下 文中 说 明 的 那样 。 

一 些 线 程 接口 既 设 计 用 作用 户 级 线程 ， 又 用 作 核 心 级 线程 。UNIX、Open VMS, OS/2, 
Windows NTR Windows 95 的 大 多 数 变 体 都 具有 开放 软件 基金 会 (Open Software 
Foundation ) 的 分 布 式 计 算 环 境 ( Distributed Computing Environment, DCE ), ff &&DCE. 
一 般 地 ， 如 果 主 机 的 操作 系统 支持 ，DCE 线 程 就 使 用 核心 级 线程 ; 否则 ， DCE 线 程 就 被 实现 
为 用 户 级 线程 。DCE 线 程 接口 有 50 多 个 函数 ， 比 本 章 的 其 他 三 个 接 中 要 大 很 多 , 但是，DCE 
接口 的 功能 也 更 多 。 例如， 它 的 实现 支持 线程 级 信号 ， 保护 对 标准 库 函数 调用 的 适当 同步 。 

Sun Microsystem 的 Solaris 2 操作 系统 具有 一 个 两 级 线程 工具 。 LR BE BAR AF te: 
进程 或 LWP; 每 个 UNIX“ 重 时 ”进程 至 少 有 一 个 LWP。Solaris 运 行 -个 或 多 个 LWP 以 运行 
一 个 UNIX 进 程 。 对 LWP 的 核心 支持 包括 非 阻塞 1O 太 每 LWP 信 号 。 用 户 级 线程 由 一 个 类 似 
于 Thread 但 比 Thread 大 的 接口 提供 ， 一 个 LWP 林 以 服务 于 一 个 或 更 多 用 户 级 线程 。Solaris 在 
LWP 之 间 多 路 复 用 处 理 器 ， 并 像 这 样 在 用 户 级 线程 之 间 复 用 自身 。 

POSIX ( Portable Operating Systems Interface ， 使 携 式 操作 系统 接口 ) 线程 接口 简 
称 pthread 一 一 是 作为 重要 的 标准 线程 接 门 出 现 的 。 大 多 数 商 家 现在 都 提供 pthread 的 实现 ， 
可 能 是 基于 他 们 自已 的 线程 接口 。 例 如 ，Sun Microsystems 使 用 Solaris 2 LWP 实 更 pthread , 
Pthread 工 具 是 Thread 和 Sem 导出 的 那些 两 数 的 父 集 。 EK- - 些 的 POSIX 接 口 可 以 处 理 每 线程 
信和 号， 包含 几 种 同步 机 制 ， 以 以 指定 哪个 标准 C 库 函数 必须 是 线程 安全 的 。 
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20.1 #0 


小 章 中 的 这 三 个 接口 每 个 都 很 小 ; 它们 被 分 成 单独 的 接口 ， 因 为 每 个 接口 都 有 一 个 相关 
但 截然 不 同 的 意图 。 

理论 上 ， 所 有 运行 着 的 线程 都 是 并 行 运行 ， 但 实际 上 ， 线 程 通常 比 实际 的 处 理 器 多 。 内 而 
处 理 器 会 根据 一 个 调度 策略 在 运行 的 线程 之 间 进 行 多 路 复 用 ; 采用 无 优先 权 调 度 ， 运 行 的 线程 
执行 一 个 盟 数 可 能 会 将 共 阻 蹇 ， 或 相反 ， 群 放 藉 处理 器 。 采 用 有 优先 权 调度 ， 运 行 的 线程 隐 式 
地 放弃 它 的 处 理 器 。 这 种 策略 通常 用 时 钟 中 斯 实现 定期 的 中 断 ， 并 将 其 处 理 器 给 另 一 个 运行 中 
的 线程 。 份 额 足 线程 特 取得 优先 权 运 行 之 前 的 时 间 量 ， 线 程 取得 优先 权时 上 下 文 切 近 (contéxt 
switch) HERS MAR, BMA (TR) 运行 线程 。 如 果 一 个 运行 的 线程 被 阻塞 ， 
也 会 发 生 无 优先 权 测 度 的 上 下 文 切换 。 如 果 Thread 搂 口 的 实现 支持， 它 就 使 用 优先 权 。 

原子 行为 的 执行 没有 优先 权 ， 启 动 执 行 原 季 行为 的 线程 将 完成 该 行为 ， 不 会 被 劳 一 线程 
中 断 。 如 果 线 程 调用 一 个 原子 函数 ， 该 调 川 的 执行 就 不 会 被 中 断 。 本 章 介 绍 的 大 多 数 函 数 必 
贷 是 原子 函数， 这 样 才 可 以 预测 它们 的 结果 和 作用 ,但 是 原子 函数 可 能 会 死 锁 ，Sem 接 口中 
的 问 步 函数 就 是 个 例子 。 E 

EMRE RAB NAR, JECHBEUN C DO RU OLA, CAFE MERIT IDA 
例如 ,线程 可 能 称 为 轻 量 进程 、 任 务 , 子 任务 或 微 任 务 ; 同步 机 制 可 能 称 为 事件 、 条 件 变量 、 
同步 资源 以 及 消息 。 








20.1.1 Thread 


Thread 接 口 导出 一 个 异常 及 支持 线程 创建 的 函数 。 
{thread hys 

#ifndef THREAD INCLUDED 

#define THREAD INCLUDED 

#include "except.h" 


fdefine T Thread. T 
typedef struct T *T; 


extern const Except T Thread. Failed; 
extern const Except T Thread Alerted; 


extern int Thread init (int preempt, ...); 
extern T Thread.new (int apply(void *), 
void *args, int nbytes, ...); 


extern void Thread exit (int code); 
extern void Thread alert(T t); 
extern T Thread.self (void); 
extern int Thread. join (T t); 
extern void Thread. pause(void) ; 


fundef T 
fendif 
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对 此 接口 中 所 有 函数 的 测 用 部 具有 原 了 性 ， 

Thread_init 初 始 化 线程 系统 ; 必须 在 调用 其 他 任何 函数 之 前 油 用 该 卫 数 ， 在 Thread_init 
之 前 济 用 此 接口 或 Sem 与 Chan 接 [11 的 其 他 任何 商 数 ,或 多 次 调用 Thread_init 都 会 引发 可 检 合 
的 运行 期 错误 。 

如 果 Preempt 为 0，Thread_init 就 把 线程 系统 初始 化 为 仅 支 持 堪 优先 权 的 调度 ， 并 返回 1。 
如 果 preempt 为 1 ， 线 程 系统 就 初始 化 为 有 优先 权 调 度 。 如 果 支 持 优先 级 ，Thread_init 则 返回 
1; 和 否则， 系统 初始 化 为 无 优先 仅 测 底 ， 岂 Thread_inir 返 回 0。 

一 般 客 户 调用 程序 在 main 中 初始 化 线程 系统 。 例 如 ， 对 于 需要 优先 权 的 客户 蛮 用 程序 ， 
main 通 常 具有 如 下 的 形式 。 


int main(int argc, char *argv[]) { 
int preempt; 


preempt = Thread_init(1, NULL); 
assert(preempt == 1); 


Thread_exitCEXIT_SUCCESS) ; 
return EXIT_SUCCESS; 
了 
Thread_init 也 可 以 接受 依赖 十 实现 的 其 他 参数 ， 经 常 出 名 称 - 数值 对 指定 。 例 如 ， 对 十 
支持 优先 权 的 实现 ， 
preempt = Thread init(1, "priorities", 4, NULL); 
BAC RAR BR CN k AR. RART EB NOR KEU AER T 使 用 这 种 方法 的 实 
现 通常 都 斯 望 以 空 指针 作为 终止 参数 。 
正如 上 述 代码 模板 所 表明 的 ,线程 必须 调用 Thread_exit 结 束 运 行 . 整数 参数 是 个 退 出 码 ， 
更 像 传递 给 标准 库 中 exit on Bf ICA et 可 能 在 等 待 调用 线程 消亡 的 其 他 线程 可 以 获得 这 
个 值 ， 参 见 下 文 说 明 。 如 果 系 统 中 内 有 一 个 线程 ， Ii HIThread, exit st $ ffr T Y4JHexit , 
Thread_new 创 建新 线程 并 返回 它 的 线程 句柄 ， 这 是 一 个 陷 式 指针 ;线程 何 森 被 传递 给 
Thread self, 新 线程 独立 丁 它 的 创建 线程 而 运行 。 当 新 线程 开始 执行 ， 它 相 当 于 执行 
void *p = ALLOC(nbytes); 


memcpy(p, args, nbytes); 
Thread exit(apply(p)); 


即 ，apply 调 用 的 参数 为 args 所 指向 的 nbytes 字 节 的 副本。 这 里 args 似 定 为 指向 新 线程 的 参数 
数据 。args 经 党 是 个 指向 结构 的 搭 外， 结构 的 字段 保 ffapply 的 参数 ，nbytes 是 那个 结 构 的 大 
小 。 新 线程 开始 执行 时 异常 堆栈 为 它 并 不 继承 其 调 用 线程 中 TRY-EXCEPT 语 句 所 建立 
的 异常 状态 。 异 常 是 针对 线程 的 ; -个 线程 里 执行 的 TRY-EXCEPT 语 名 不 能 影响 另 一 线程 
中 的 异常 。 

如 果 args 非 空 卫 nbytes 为 零 ， 新 线程 的 执行 就 相当 于 执行 

Thread, exit(apply(args)); 
期 ，args 传 递 给 林 修 改 的 apply 。 如 果 args 为 空 ， 新 线程 就 等 价 于 执行 
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Thread, exit(apply(NULL)) ; 
或 args JJ 2s Binbytes 为 负 时 引发 一 个 可 检查 的 运行 期 错误 。 如果 args 为 空 ， 则 忽 





apply Aa. 
略 nbytes , 

与 Thread_init 相 同 ，Thbread_new 会 接受 针对 十 实现 的 其 他 参数 ， 常 由 名 称 - 数值 对 指定 。 

Thread_T t; 

t = Thread new(apply, args, nbytes, "priority", 2, NULL); 

Be TAF, KUE Y — MERA RB. LEGE TP FARRAR, ape S Bony ee 
小 于 一 个 空 指针 。 

线程 的 创建 是 同步 的 ; Thread_new 在 新 线程 创建 并 接收 到 其 参数 后 、 但 可 能 在 新 线程 开 
始 执 行 之 前 返回 ， 如 凡 Thread_new 川 于 资源 限制 而 不 能 创建 新 线程 则 会 引发 Thread_Failed . 
例如 .实现 可 能 会 限制 能 够 同时 在 在 的 线程 数 ， 当 超 过 这 个 限制 时 ，Thread_new 就 会 引发 
Thread_Failed 。 

Thread_exit(tcode) 结 来 调用 线程 的 执行 。 等 待 调用 线程 终止 的 线 称 (依靠 Thread_join ) 
可 以 重新 开始 ， 同 时 code 的 值 作为 每 个 正 新 开始 的 线程 里 Thread_ join 调用 结果 返回 。 当 最 后 
一 个 线程 调用 Tbread_exit ， 整 个 程序 就 通过 调用 exit(code) 结 束 - 

Thread_join(D 使 调用 线 称 拷 起 直到 线程 调用 Thread_exit 结 来 ， 当 线 各 结束 ， 调 用 线程 
就 重新 开始 ， 而 FLThread_join 返 同 Ht 传 递 给 Thread_exit 的 整数 。 如 内 ! 给 不 存在 的 线程 命名， 
Thread_join 立 即 返回 -1 。 有 种 特殊 情况 ，Thread_join(NULL) 的 油 用 会 等 待 所 有 线程 结 
包括 可 能 是 由 其 他 线程 创建 的 邵 些 线程 。 这 种 情况 下 ，Thread_join 返 回 0 , tz: 的 给 调用 线 
程 命名 ,或 多 个 线程 指定 一 个 空 t， 孝 是 一 个 可 检查 的 运行 期 错误 。 Thread_join 可 以 引发 
Thread_Alerted , 

Thread_self 返 回调 用 线程 的 线程 句 栖 。 

Thread_pause 让 测 用 线程 放弃 处 理 器 ， 如 果 有 有 线程 已 经 准备 好 运行 ， 就 供 田 一- 准备 好 的 
线程 运行 。Thread_pause 主 要 用 于 无 优先 权 的 届 度 ， A Ae BUDE ANA BAT hread_pause 。 

线程 有 三 种 状态 : dd. MEANT 新 线程 从 运行 开始 。 如 果 它 调用 Thread join, it 
ERRE, FREAR. 4- -个 线程 调用 Thread_exit， 它 就 消 由 了， 线程 疝 用 Chan 
导出 的 通信 盯 数 或 Sem 导 出 的 同步 明 数 时 也 会 阻塞 ， 而 没有 运行 由 的 线程 就 会 引发 可 检查 的 
运行 期 错误 。 

Thread alert (t) EtA "Ape os HA, WR, Thread_alert (let alia 47 . 并 为 
它 做 准备 以 清空 它 的 末次 警示 标志 .在 它 下 次 了 的 时 候 引 发 Thread_Alerted。 如 果 ( 已 经 运 
行 ，Thread_aiert 调 度 { 清 空 它 的 标志 ， 首 在 下 次 它 调用 Thread_join 尸 者 ER e 38 (ei ex pa] o oi š 
的 时 候 引 发 Thread_Alerted , (s)|Thread alertf ih ^s] Hay ARLE AE WER 103988 B|: 的 
运行 期 错误 。 

运行 的 线程 无 法 终止 ; 线程 必须 自行 结束 ， 或 者 通过 调用 Thread_exit， 或 者 通过 响应 
Thread_Alerted 。 如 果 线程 没有 捕 所 Thread_Alerted。 整 个 称 序 将 终 外 T -个 本 捕获 的 异常 
错误 。 对 警告 的 最 常见 响应 就 是 终 引线 程 ， 具 有 如 下 舱 形 式 的 apply 函 数 可 以 终止 线程 。 
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int apply(void *p) f 
TRY 


EXCEPT (Thread. Alerted) 

Thread. exit(EXIT. FAILURE) ; 
END TRY; 
Thread. exit(EXIT SUCCESS) ; 


H 
TRY-EXCEPT 语 句 必须 由 线程 木 身 执行 。 诸 如 
Thread_T t; 

TRY 


t = Thread newC..); 
EXCEPT(Thread_Alerted) 

Thread. exit (EXIT. FAILURE) ; 
END_TRY; 
Thread_exitCEXIT_SUCCESS) ; 


的 代码 不 止 确 ， 央 为 TRY-EXCEPT 应 用 于 调用 线程 RK AR 。 
20.1.2 一 般 信 号 量 


一 般 信 号 量 或 底数 信号 其 尾 低 级 同步 原 语 。 理 论 上 ， 信 号 景 是 个 可 以 原子 性 地 增加 和 减 
少 的 受 保护 整数 。 关 于 信号 最 s 的 两 个 操作 是 wait 和 signal。signal (s ) 3E $8 F SH TREE 
的 增加 ; wait (s) 等 待 为 于， 然后 再 进行 原子 性 的 消减 : 

while (s <= 0) 


s- 1; 
当然 ， 实 际 的 实现 会 阻塞 调用 线程 ; 它们 不 像 这 里 解释 的 那样 循环 。 
Sem 接 门将 计数 器 封装 在 一 个 结构 中 ， 并 导出 一 个 初始 化 函数 以 及 两 个 同步 画 数 : 


(sem. n= 
#ifndef SEM INCLUDED 
#define SEM INCLUDED 








#define T Sem T 
typedef struct T ( 
int count; 

void *queue; 
) T; 


(exported macros 416) 


extern void Sem init (T *s, int count); 
extern T — *Sem new Cint count); 
extern void Sem wait (T *s); 

extern void Sem signal(T *s); 


#undef T 
#endif 
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S mHigSem TAM] —^4- SPI ROTE SF. AEn ROS T Sem THIRA, mi Hit 
可 以 进行 静态 分 配 或 者 戏 人 到 其 他 结构 中 。 客 户 调用 程序 必须 将 Sem_T 当 作 一 种 隐 式 类 型 
且 仪 能 通过 该 接口 中 的 函数 访问 其 值 所 在 的 字段 ;间接 访问 Sem.T 的 字段 足 个 不 可 检查 的 运 
行 期 错误 。 给 该 接口 的 任意 晤 数 传递 空 Sem_T 指 针 ， 将 会 引发 可 检查 的 运行 期 错误 。 

Sem_init 接 爱 一 个 指向 Sem_T 的 指针 太 其 计数 器 的 初 值 ; 然后 初始 化 信号 量 的 数据 结构 ， 
并 将 其 计数 器 发 为 特定 的 初 值 .一旦 初 始 化 ,指向 Sem 了 T 的 指针 可 以 传递 给 那 两 个 同步 函数 。 
同一 信号 昔 上 多 次 调用 Sem_init 足 “个 不 可 检查 的 运行 期 错误 ， 

Sem new Ë: 

Sem T *s; 


NEW(S) ; 
Sem init(s, count); 


的 等 价 康子 函数 ， 它 可 以 引发 Mem_Failed 。 

Sem_wait 接 受 一 个 指向 Sem_T 的 指针 ， 等 待 它 的 计数 器 变 为 正 数 ， 然 后 按 1 递减 计数 器 ， 
并 返回 。 这 个 操作 是 原子 操作 。 如 果 设 置 了 调用 线程 的 末次 警示 标志 ，Sem_wait 就 会 立即 引 
发 Thread_Alerted， 且 不 减低 计数 器 。 如 果 线 程 阻塞 的 时 候 设置 未 决 警示 标志 .线程 就 不 再 
等 待 ， 并 引发 Thread_Alerted ， 且 不 减低 计数 器 ， 测 用 Thread_init 之 前 调用 Sem_wait 是 个 可 
检查 的 运行 期 错误 。 

Sem_signal 接 受 - :个 指向 Sem_T 的 指针 并 原子 性 增加 计数 器 。 如 果 其 他 线程 在 等 待 计数 
器 变 为 正 数 ， 而 Sem_signal 使 它 为 正 ， 则 些 线程 的 其 中 一 个 就 会 完成 Sem_wait 的 调用 ， 调 出 
Thread._init 之 前 调用 Sem_wait 是 个 可 检查 的 运行 期 错误 。 

向 Sem_wait 或 Sem_signal 传 递 未 初始 化 的 入 号 量 是 个 不 可 从 查 的 运行 期 错误 

Sem_wait 和 Sem_signal 操 作 中 隐 含 的 排队 过 程 是 先 人 先 出 ; 这 是 公 绊 的 。 也 就 是 说 ， 阻 
塞 在 信号 其 s 的 线程 将 在 t 之 后 调用 Sem_wait (&s ) 的 其 他 线 称 之 前 重新 开始 。 

二 进 制 信号 其 互 斥 体 是 个 一 般 信号 景 ， 它 的 计数 器 是 0 或 1。 互 斥 体 用 于 此 斥 现象 。 举 个 
例子 ， 


Sem_T mutex; 
Sem init(&mutex, 1); 








Sem wait(&mutex); 
statements 
Sem signal(&mutex); 


MEHMAN HOUR SR. AEREA EUR — SER BE BIA statementifi  , 
REA KW — 4 ff. RPRIBRM MUR HI. VUE Y Sem? Fil) Y AARAU TFE 
LOCK-END LOCK RAHE: 

LOCK (mutex) 


Statements 
END_LOCK 


XE SEmutex 483086 29 180 — sit SHE, LOCKEA TR ili BG IE GE 尾 调 用 
Sem_signal 以 及 调用 具有 错误 信号 量 的 Sem_signal 这 样 的 常见 的 灾难 性 的 销 误 。 
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(exported macros 416) 
#define LOCKCmutex) do ( Sem T *_yymutex = &(mutex); N 
Sem wait( yymutex); 
fdefine END LOCK Sem signal( yymutex); } while (0) 


AM statement iR WAT VAS| RSE, JE Z— FEA BERE THLOCK-END. LOCK, FS Zu An A A AERE 
H, mutex RRRS. AAL F, GEHE DRE AE 
TRY 
Sem wait(&mutex); 
Statements 
FINALLY 
Sem_signal (&mutex) ; 
END_TRY; 
FINALLY 8 £56 de f DE LAE AER RO nutex 。 另 一 个 合理 的 方法 是 在 LOCK 和 
END_-LOCK 的 定义 中 结合 这 种 术 酒 ， 但 足 这 之 后 每 次 使 用 LOCK-END_LOCK 都 会 执 致 
TRY-FINALLY 语 句 的 系统 开销 。 
互 斥 信号 量 mutex 经 常 嵌 在 ADT 中 保 让 ADT 的 访问 是 线程 安全 的 ， 例 如 ， 
typedef struct í 
Sem_T mutex; 


Table_T table; 
} Protected_Table_T; 


将 mutex 与 table 相 关联 。 代 全 


Protected_Table_T tab; 
tab.table = Table_new(...); 
Sem_init(&tab.mutex, 1); 


创建 了 一 个 受 保护 的 表 ; 
LOCK(tab.mutex) 
value - Table get(tab.table, key); 
END. LOCK ; 
原子 性 地 获取 与 Key 相关 的 值 。 TES. LOCK felonutex ifidF Hb lk, DLE Table, put?T 14 | 
发 Mem_Failed ， 所 以 tab 的 加 法 应 当 用 如 下 的 代码 实现 ; 


TRY 

Sem wait(&tab.mutex); 

Table put(tab.table, key, value); 
FINALLY 

Sem signal(&tab.mutex); 
END TRY; 


20.1.3 同步 通信 通道 


Chan 搂 口 提 供 可 用 于 线程 之 癌 传递 数据 的 同步 通信 通道 


(chan. We 
#ifndef CHAN INCLUDED 
#define CHAN_INCLUDED 
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#define T Chan_T 
typedef struct T *T; 


extern T Chan new (oid); I . 
extern int Chan send (T c, const void *ptr, int size): 
extern int Chan receive(T c, void *ptr, int size); 


#undef T 
*endif 
Chan_new 创 建 、 初 始 化 及 返回 一 个 新 通道 ， 这 是 个 指针 。Chan_new 可 以 引发 Mem_Fajled 。 
Chan_send 接 受 个 通道 ,也 好 一 个 指向 保存 发 送 数据 及 绥 串 区 容纳 宁 节 数 的 缓冲 区 的 指针 . 
WAHAB BSS. WEA 线程 油 用 具有 向 一 通道 的 Chan_receive ; 当 发 生 这 种 会 全 时 ， 就 从 
发 送 方 处 将 数据 拷贝 到 接收 方 ， 然后 两 个 函数 都 返回 。Chan_send 返 四 接收 方 接收 的 字 节 数 。 
Chan_receive 接 受 个 通道 ， 也 好 一 个 指 疝 保存 接收 藏 所 总 其 可 容纳 的 最 大 字 告 数 的 组 
冲 区 指针 。 调用 者 - -点 等 待 直 到 另 一 线程 调用 具有 同一 通道 的 Chan_send; 当 发 生 这 种 会 合 
时 ,数据 就 从 发 送 方 处 拷贝 到 接收 方 ,然后 两 个 函数 邵 返 回 。 MURR REA ET 
size, £N ME IRESI T. Chan receive g PLES AYE C 
Chan_send#ilChan_receive #z 220 size 。 向 任 ” 函数 传递 空 Chan T, 空 ptr 或 人 size 部 会 
SUR AT AS dE METUS UR. WIR EEUU HY HER IR HD JQ p Chan send 和 
Chan_receive 立 刻 就 会 引发 Thread_Alerted ， 如 果 线 各 阻塞 的 时 候 设置 未 决 警示 标志 ,线程 
就 不 再 等 待 ， 并 引发 Thread_Alerted 。 这 种 情况 下 ， 数 据 可 能 传输 过 二 也 可 能 没有 传 答 。 
调用 Thread_init 之 前 调用 这 个 接口 中 的 任 - .因数 都 是 可 检查 的 运行 期 错误 。 


ER 
A. 








20.2 示例 


ARTY BS 4385482 r REAREN A YEH. AREE SUR [962 MEME MO, 将 站 下 节 
详细 介绍 的 Chan 实 现 足 同步 信号 曲 的 使 用 示例 。 


20.2.1 并 行 排序 


如 果 有 优先 权 ， 线 程 都 会 并 行 执行 至 少 理论 上 足 这 样 ， 一 组 协同 操作 的 线程 可 以 处 再 
问题 的 各 个 独立 部 分 。 在 多 处 理 器 的 系统 上 ， 这 种 方法 使 用 并 发 性 减少 整体 的 执行 时 间 。 当 
然 ， 在 单 处 理 器 系统 上 ， 这 个 程序 实际 上 运行 得 会 慢 -点 ， 内 为 在 线程 问 切换 需要 系统 开销 
但 是 ， 这 种 方法 的 确 说 明了 Thread 接 口 的 使 用 。 

排序 这 个 问题 很 容易 可 以 分 解 成 独立 的 子 部 分 。 sort 生 成 特定 数 其 的 随机 整数 ,进行 并 
行 排序 ， 然 后 检查 结果 排 座 的 情况 ， 

(sort.c)- 

#include <stdlib.h> 
#include <stdio.h> 
#include <time.h> 


#include "assert.h" 
#include "fmt.h" 
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#include "thread.h" 
#include "mem.h" 


(sort types 421) 
(sort data 422) 
(sort functions 420) 


main(int argc, char *argv(]) í 
int i, n = 100000, *x, preempt; 


preempt = Thread init(l, NULL); 
assert(preempt == 1); 
if (argc >= 2) 
n = atoi(argv[1]); 
x = CALLOC(n, sizeof Cint)); 
srand(time(NULL)) ; 
for G = 0; i < n; i++) 
x[i] = randQ; 
sort(x, n, argc, argv); 
for G = 1; í < n; dee 
if Cx[i] < x[i-1]) 
break; 
assert(i == n); 
Thread_exit(EXIT_SUCCESS); 
return EXIT_SUCCESS; 
H 


time, srandfürand App HEC RE , time JRF H Bo ñr IR] —2E E 8862, Imisrandj%4# Fix ded 
SAUCE FAT HE HR US ELCHE PURO RP. 1 POR Tl Fl rand i IX Fe P rp 89 BALK, sort — FF 
始 以 n 个 随机 数 填充 x[0..n-1] 

函数 sort 是 快速 排序 的 一 个 实现 . 教科 书 上 用 “中 心 ” 值 把 这 个 数组 分 成 其 个 子 数组 . 
然后 递归 调用 自身 排序 每 个 子 数组 。 子 数组 为 空 时 递归 到 达 最 底 端 。 

void quickCint a[], int 1b, int ub) í 

if (ib < ub) { 
int k = partition(a, lb, ub); 


quick(a, lb, k - 1); 
quick(a, k + 1, ub); 


} 


void sortCint *x, int n, int argc, char *argv[]) { 
quick(x, 0, n - 1); 





H 

partition[a, i, j Ej Pai E y ra 8. AN ek Ha, Malik- P T BE 
BRUN TRE PR Svs akt j ré PER REK Tv; aD ate, 

(sort functions 420)= 


int partitionCint a[], int i, int jt 
int v, k, t; 
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& 8 
ien 
k= i; 
v = a[k]; 


while G < j) í 
i++; while (a[i] < v && í < j) i++; 
j--; while (a[j] > v ) j--; 
if G < D ít = ali]; alil = acj]; aljl = t; } 


H 
t = alk}; afk) = a[j]; alj] = t; 
return j; 


} 
partitions Je — X 3546 tev A Halk] + , partition 返回 kK。 
对 quick 的 递归 调用 可 由 单独 的 线程 并 行 执行 HIE, quick 的 参数 必须 打包 在 一 个 结构 
中 ， 这 样 quick 可 以 传递 到 Thread_new; 


(sort types 421)= 
struct args { 
int *a; 
int lb, ub; 
5 


(sort functions 420)+= 
int quick(void *cl) í 
struct args *p = cl; 
int tb = p->1b, ub = p->ub; 


if Ob < ub) { 
int k = partition(p->a, ]b, ub); 
(quick 421) 


Y 
return EXIT. SUCCESS ; 
i 


递归 泗 用 在 单个 线程 中 执行 ， 而 且 就 像 子 数 组 里 有 是 够 的 元 索 值 得 这 伴 做 。 例 如 ， 
a[lb..x-1ij 这 样 排序 : 


(quick 421)= 
p-»lb = 1b; 
p->ub = k - 1; 
if (k - lb > cutoff) í 
Thread_T t; 
t = Thread_new(quick, p, sizeof *p, NULL); 
Fmt print("thread Xp sorted %d..%d\n", t, lb, k - D; 
} else 
quick(p); 


这 里 cutoff 给 出 单个 线 杜 里 排序 所 需 的 最 少 元 素数 。 类 位 地 ，alk+1..ub] 这 样 排序 : 
(quick 421)+= 
p->lb = k + 1; 


p->ub = ub; 
if (ub - k > cutoff) í 
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Thread. T t; 
t = Thread new(quick, p, sizeof *p, NULL); 
Fmt_print("thread %p sorted %d..%d\n", t, k + 1, ub); 
} else 
quick(p); 
soft 最 先 调 用 quick， 它 存 排 序 进展 过 程 由 产生 很 多 线程 ; 调用 Thread_ join 等 待 所 有 这 些 
gu. 


(sort data 422)= 
int cutoff - 10000; 


(sort functions 420542 
void sort(int *x, int n, int argc, char *argv[]) { 
struct args args; 


if (argc >= 3) 
cutoff = atoi(argv[2]); 
args.a = x; 
args.lb = 0; 
args.ub = n - 1; 
quick(&args); 
Thread, join(NULL) ; 
i 
Fn Flcutofé iy Bk i ff 100 0004110 000 执 行 sort , P418 MER Pe. 


* sort 

thread 69f08 sorted 0..51162 
thread 6dfeO sorted 51164..99999 
thread 72028 sorted 51164..73326 
thread 76070 sorted 73328..99999 
thread 6dfe0 sorted 51593..73326 
thread 72028 sorted 73328..91415 








zn thread 7a0b8 sorted 51593..69678 








thread 7e100 sorted 73328..83741 
thread 82148 sorted 3280..51162 
thread 69f08 sorted 73328..83614 
thread 7e100 sorted 51593..67132 
thread 6dfe0 sorted 7931..51162 
thread 69f08 sorted 14687..51162 
thread 6dfe0 sorted 14687..37814 
thread 72028 sorted 37816..51162 
thread 69f08 sorted 15696..37814 
thread 6dfe0 sorted 15696..26140 
thread 76070 sorted 26142..37814 


不 同 的 执行 给 不 同 的 值 排序 ， 内 此 quick 每 次 执行 所 创建 的 线程 数 呈 及 打印 的 记录 数量 也 会 
TH. 

sort PERRI: 它 不 能 包含 quick 中 的 Fmt_print 调 用 , 不 能 确保 FEmt_print 可 以 再 
次 进 和 人， 而 且 C 库 巾 的 许多 例 程 都 中 不 可 再 次 进入 的 .什么 也 不 能 保证 printt 或 其 他 任何 库 程 
序 中 断 以 后 再 重新 开始 仍 将 正确 运 和 
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20.2.2 临界 区 


在 在 优先 友 的 系统 中 任何 被 多 个 线程 访问 的 数据 都 必须 得 到 保护 。 访问 必 须 限制 在 一 个 
临 田 区 中 ， 这 个 区 域 小 一 次 只 允许 运行 一 个 线程 。spin 吓 个 简单 的 范例 ,说 明了 访问 共享 数 
据 的 正确 方式 和 错误 方式 。 


{spin.O= 
#inctude <stdio.h> 
#include <stdlib.h> 
#include "assert.h" 
#include "fmt.h" 
#include "thread.h" 
#include "sem.h" 


#define NBUMP 30000 


(spin types 425) 
(spin functions 424) 


int n; 
int main(int argc, char *argv[]) f 
int m= 5, preempt; 


preempt = Thread init(1, NULL); 
assert(preempt == 1); 
if (argc >= 2) 
m = atoi(argv[1]}; 
n= 0; 
(increment n unsafely 424) 
Fmt print("Xd == %d\n", n, NBUMP*m); 
n = 0; 
(increment n safely 425) 
Fmt print("Xd == %d\n", n, NBUMP*m); 
Thread. exit(EXIT. SUCCESS) ; 
return EXIT. SUCCESS; 
) 


spin 生 成 m 个 线程 ， 每 个 者 递增 nNBUMP 次 。 首 先生 成 的 m 个 线程 不 能 确保 n 是 原子 性 地 递增 , 


(increment n unsafely 424)= 


int i; 
for G = 0; i < m; i++) 
Thread new(unsafe, &n, 0, NULL); 
Thread. join(NULL); 
了 


main 创建 这 上 个 线程 ， 每 个 都 调 用 nsafe， 并 用 指针 指向 n 的 指针 : 


(spin functions 424)= 
int unsafe(void *c1) { 
int i, *ip = cl; 


423 
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424 














425 








for (i = 0; í < NBUMP; i++) 
“ip = *ip + 1; 
return EXIT_SUCCESS; 
} 
unsafe 2 SIF MAI, yt ip=*ip+) UT BY RE e Bor BT. fm RA RR ip ZR PT, 
WE AEN pE. HEZ RET ip MU ste dt. 
一 批 生成 的 年 个 线程 于 用 





(spin types 425)= 
Struct args { 
Sem_T *mutex; 
int *ip; 


uH 


(spin functions 424)+= 
int safe(void *cl) { 


struct args *p = c]; 
int i; 


for (i = 0; i < NBUMP; i++) 
LOCK(*p-»mutex) 
*p-»ip = *p-»ip + 1; 
END_LOCK; 
return EXIT_SUCCESS; 
H 


Safe f FREUE EUR — PRP TERT TIGR, ALES *ips*ipel, main dy fede PPS 2092 38 
用 以 在 safe 中 输入 临界 区 的 一 个 二 进 制 信和 号 量 


(increment n safely 425)= 


int i; 
struct args args; 
Sem_T mutex; 
Sem init(&mutex, 1); 
args.mutex - &mutex; 
args.ip - &n; 
for (i = 0; í < m; i++) 
Thread new(safe, &args, sizeof args, NULL); 
Thread. join(NULL) ; 
了 


任何 时 候 都 会 发 生 抢 占 ， 内 此 使 用 ansafe 的 线程 每 次 执行 spin 都 会 产生 不 同 的 结果 : 


% spin 
87102 == 150000 
150000 == 150000 
% spin 
148864 == 150000 
150000 == 150000 
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20.2.3 生成 素数 





最 后 一 个 例子 是 说 明 由 通信 通道 实现 的 管道 ，sieve MERAH IATER E TN RR. 
fum: 
* sieve 100 


23571113 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 
79 83 89 97 


sieve 实 现 了 计算 泰 数 的 著名 埃 拉 托 色 尼 绊 ， 其 中 每 个 “筛子 ”都 是 一 个 含 齐 了 它 的 素数 
倍数 的 线程 ， 通 道 把 这 些 线程 连 楼 起 来 形成 一 个 管道 ， 如 图 20-1 所 六 。 源 线程 ( 白 框 ) 生成 
2 及 2 以 后 的 奇数 ， 并 将 它们 送 人 管道 。source 和 sink ( K EAE) 之 问 的 过 滤器 ( 浅 灰 色 框 ) 
去 掉 它 们 的 素数 倍数 ， 并 把 其 他 数 传递 出 去 。sink 也 会 过 滤 出 它 的 素数 ， 但 是 如 果 一 个 数 是 
通过 sink 的 过 滤器 得 到 的 ， 那 它 就 是 个 素数 。 图 20-1 中 的 每 个 方 杠 都 是 个 线程 ; 框 中 的 数 也 
都 旦 与 那个 线 释 相关 的 素数 。 方 框 之 间 构 成 管道 的 直线 就 毗 通道 。 


source filter filter sink 
3 
2 13 Saz 
2,3. 5, 3 17 31 
———— 5 —, —— BE 

7 


23 
n 29 
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sink 和 每 个 filter 里 放 有 mn 个 素数 。 当 sink 收 集 到 n 个 素数 一 一 图 20-1 中 为 3 个 一 一 它 就 生成 自 
身 的 一 个 副本 并 转换 成 filter。 图 20-2 说 明了 sieve 计 算 100 以 内 包括 100 的 素数 时 ， 如 何 进行 扩展 。 

sieve 初 始 化 线程 系统 后 ， 就 为 source 和 sink 生 成 线程 ， 并 用 新 的 通道 将 它们 连接 起 来 ， 
然后 退出 : 


dsieve.c= 
#include <stdio.h> 
#include <stdlib.h> 
#include "assert.h" 
#include "fmt.h" 
finclude "thread .h" 
#include "chan.h" 








struct args { 
Chan_T c; 
int n, last; 
J; 


(sieve functions 429》 


int main(int argc, char *argv[]) í 
struct args args; 


Thread imit(1, NULL); 
args.c = Chan newO; 
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Thread_new(source, &args, sizeof args, NULL); 
args.n = argc > 2 ? atoi(argv[2]) : 5; 
args.last = argc > 1 ? atoi(argv[1]) : 1000; 
Thread. new(sink, éargs, sizeof args, NULL); 
Thread. exit(EXIT. SUCCESS) ; 
return EXIT SUCCESS; 

1 


source SEEK eat BIE dU “SW Hi” 383, targs t thie F Et — tt source te ER fE — 

















428 











字段 中 传递 ， 


source sink 
























































31 53 73 
37 59 79 
-一 一  — s 一 一 
43 67 89 
47 ?1 [97 





图 20-2 100 以 内 素数 筛子 的 发 展 


(sieve functions 429)= 
int source(void *cl) í 
struct args *p = cl; 
int i = 2; 
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if (Chan.send(p-»c, &i, sizeof i)) 
for (i = 3; Chan send(p-»c, &i, sizeof i); ) 
i += 2; 
return EXIT_SUCCESS; 
} 
AE BUC TRL, sources 2 MM SHAM RK, 一旦 sink 打 印 出 所 有 的 素数 ， 就 从 它 
的 输入 通道 丐 取 0 字 节 内 容 ， 给 土 流 过 滤器 发 送信 号 通知 它 作 业已 经 完成 且 终 止 了 。 每 个 
filter 的 工作 都 相同 ， 直 到 source 监 昕 到 它 的 接收 方 恋 皮 0 字 节 内 容 并 终止 执行 。 
filter 从 它 的 输入 通道 读 取 整数 并 向 它 的 给 出 通道 写 和 潜在 的 素数 ， 直 到 接收 这 些 可 能 素 
数 的 线程 不 能 再 接收 为 目 : 
(sieve functions 429)+= 
void filterCint primes[], Chan. T input, Chan T output) { 
int j, x; 






for G3) 1 
Chan.receive(input, &x, sizeof x); 
(x is a multiple of primes [0...] 429) 
if (primes[j] == 0) 
Jf (Chan send(output, &x, sizeof x) == 0) 
break; 
} 
Chan_receiveCinput, &x, 0); 
1 


primes[0..n-1] 4743 Xfilter R BW. p BER LOSE, DN EHE MIR Fd primes , 
直到 它 确定 x 不 是 素 数 或 遇 到 结束 符号 : 


(x is a multiple of primes[0...] 429)= 
for (j = 0; primes[j] {= 0 && x*primes[j] != 0; j++) 


止 如 上 述 代码 所 表明 的 , 搜索 结束 十 终止 符 0 时 就 失败 Vo 这 种 情况 下 ，x 可 能 是 个 素数 ， 
央 此 还 要 把 它 送 入 输出 通道 发 送 给 另 一 filter 或 发 送 给 sink 。 

所 有 的 行为 都 在 sink P; args 的 ce 字段 保存 了 sink 的 输入 通道 ;na 字段 给 出 了 每 个 filter 的 素 
数 数量 ; last 字 符 保 存 N， 这 是 期 钥 的 素数 范围 ，sink 初 始 化 它 的 primes 数 组 并 览 听 它 的 输入 : 


(sieve functions 429)+= 
int sink(void *c1) { 
Struct args *p = cl; 
Chan_T input = p->c; 
int i = 0, j, x, primes[256]; 


primes[0] = 0; 
for GD { 
Chan_receiveCinput, &x, sizeof x); 
(x is a multiple of primes [0...] 429) 
if Cprimes[j] == 0) { 
(x is prime 430) 


H 





429 








430 














431 
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l 
Fmt. print("Nn"); 
Chan_receiveCinput, &x, 0); 
return EXIT. SUCCESS; 
} 
dnx A primes H- .个 非 零 数值 的 倍数 ， 那 它 就 是 个 素数 ， 然 后 sink 就 将 它 打 印 出 来 并 添加 
到 primes 中 。 


(x is prime 430)= 
if (x > p->last) 
break; 
Fmt print(" Xd", x); 
primes[it+] = x; 
primes[i] = 0; 
if (i == p-n) 
(spawn a new sink and call filter 431) 


XX-Fp-lasthi, HAM BY AMC MAT er. sink ID DANGER D. RSA, ER 
来 自 于 其 输入 通道 中 的 多 个 整数 ， 但 是 读 取 0 池 节 ， 即 给 上流 线程 发 信号 通知 计算 完成 。 
Sink 收 集 到 n 个 素数 后 就 把 自身 克隆 一 下 ， 并 变 成 还 需要 一 个 新 通道 的 fter， 


(spawn a new sink and call filter 43132 


t 
p->c = Chan_new(); 
Thread new(sink, p, sizeof *p, NULL); 
filter(primes, input, p-»c); 
return EXIT SUCCESS; 
} 


新 通道 变 成 副本 的 输入 通道 及 filter 的 输入 通道 。sink 的 输入 通道 即 filter 的 给 入 通道 。filter 返 
回 时 它 的 线程 就 退出 了。 

sieye 中 线程 之 间 的 所 有 切换 部 发 生 在 Chan_send 和 Chan_receive 中 ， 侧 且 总 旦 至 少 有 - 
个 线程 可 以 运行 。 这 样 ，sieve 可 以 采用 有 优先 权 调 度 运行 ， 也 可 以 采用 无 优先 羽 调 度 ; E 
将 线程 主要 用 于 构造 一 个 应 用 程序 的 简单 范例 。 无 优先 权 线程 常 称 为 协 问 程序 。 


20.3 实现 


Chan 的 实现 完全 可 以 紧 接 着 Sem 的 实现 建立 ， 因 此 它 是 独立 于 机 器 的 。Sem 也 是 独立 于 
机 器 的 ， 但 它 还 依靠 Thread 实 现 的 内 部 结构 . 因此 Thread 岂 实现 了 Sem。 单 处 理 器 的 Thread 
实现 很 大 程度 上 可 AREA TF 巨 仙 也 独立 于 其 操作 系统 。 如 下 详细 介绍 ， 机 器 和 操作 系统 的 
相关 性 开始 右 延 到 仅 用 于 上 下 文 切换 和 优先 权 的 代码 ， 





20.3.1 同步 通信 通道 


Chan-T 是 指向 一 个 具有 三 个 信号 量 、-- 个 消息 指针 及 一 个 字 节 数 的 结构 的 指针 : 


(chan.oġ= 
#include <string.h> 
#include "assert.h" 
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#include "mem.h" 
#include "chan.h" 
#include "sem.h" 


#define T Chan. T 
struct T { 
Const void *ptr; 
int *size; 
Sem T send, recv, sync; 
x 
(chan functions 432) 
创建 新 线程 的 时 候 ，ptr 和 size 字 上段 还 木 定义 ， 信 和 号 景 send , recv 和 sync 的 计数 器 分 别 被 初始 
化 为 1 OMO: 
(chan functions 432)= 


T Chan new(void) { 
Tc; 


NEW(c); 
Sem_init(&c->send, 1); 
Sem init(&c-»recv, 0); 
Sem init(&c-»sync, 0); 
return c; 


} 
信号 其 send 和 recv 控 制 对 ptr 和 size 和 访问 ， 信 3 钥 sync 确 保 消息 传闻 按 Chan 接 口 所 指定 的 屠 
样 邮 步 。 线 程 通过 填充 ptr 和 sizc 字 段 发 发 送 消息 ， 们 仪 在 这 样 做 很 安全 时 这 样 做 。 Rik UD 
Apu Msizettsendy1; AM 40—PW, RR ARM ELH. DENDO, Ptr 和 size 
具有 指向 -条 消息 及 其 大 小 的 有 效 指针 时 recv 为 1 ; 否则 为 0 一 “例如 ， 在 发 送 力 设置 了 ptr 和 
size 之 前 。send 和 recv 持 续 周期 性 地 波动 recv 为 0 时 send 为 1; 反之 亦 然 。 接收 方 成 功 将 消息 
持 由 到 它 的 专用 缓冲 区 后 ，sync 为 1 。 
Chan_send 通 过 等 待 send、 填 充 ptr 和 size 、 给 recy 发 信 叶 以 及 等 待 sync 发送 消 息 ， 
(chan functions 432)+= 
int Chan send(Chan T c, const void *ptr, int size) { 
assert(c); 
assert(ptr); 
assert(size >= 0); 
Sem wait(&c-»send); 
C-»ptr = ptr; 
C-»Size = &size; 
Sem_signal (&c->recv); 
Sem_wait(&c->sync); 
return size; 





} 
com size (RFE IF BEI E ARTT CUR BOI NE, HCE UR Ie TE 
少 字 节 。Chan_receive 执 行 的 这 三 个 步 缀 补充 f Chan_send sia AAR MEA, Chan received 
过 等 待 recv 、 将 消息 复制 到 它 的 参数 缓冲 区 并 修改 字 节 数 以 及 给 sync 和 send 发 送 消息 : 
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(chan functions 432242 
int Chan receive(Chan T c, void *ptr, int size) í 
int n; 


assert(c); 
assert(ptr); 
assert(size »- 0); 
Sem wait(&c-»recv); 
n = *c->size; 
if (size < n) 
n = size; 
*c-»size = n; 
if (n > O) 
memcpy(ptr, c->ptr, n); 
Sem_signal(&c->sync); 
Sem_signal(&c->send); 
return n; 


} 








433] ?是 实际 接收 到 的 字 节 数 ， 可 能 是 0。 这 有 段 代码 处 理 所 有 二 种 情况 : 发 送 方 的 size 超 出 接收 方 








的 size 、 两 方 的 size 相 等 以 及 接收 方 的 size 超 出 了 发 送 方 的 size 。 
20.3.2 线程 


Thread 实 现 ，thread.c， 实 现 (Thread 和 Sem 接 口 : 


{thread.c)= 
#include <stdio.h> 
#include <stdlib.h> 
#include <string.h> 
#include </usr/include/signal .h> 
#include «sys/time.h» 
#include "assert.h" 
#include "mem.h" 
#include "thread.h" 
#include "sem.h" 


void _MONITOR(void) {} 
extern void _ENDMONITOR (void); 


Xdefine T Thread T 
(macros 436) 

(types 435) 

(data 435) 

(prototypes 433) 
(static functions 436) 
(thread functions 438) 
#undef T 


#define T Sem T 
(sem functions 457) 
#undef T 
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È ER MONITOR 各 外 部 函数 ENDMONITOR 仅 用 于 它们 的 地 址 。 如 下 所 述 ， 这 些 地 址 包 
括 临界 区 一 一 千 万 不 能 中 断 的 线程 代码 。 这 段 代码 中 有 少量 足 用 汇编 语言 编写 的 ， 而 且 在 这 
个 汇编 语 襄 文件 的 末尾 定义 了 _ENDMONITOR ,这 样 临界 区 也 包括 这 授 汇编 代码 。 它 的 名 
AU FRAG, AALS ABIE FIO RS SD AE TE ALBI 。 

线程 句柄 是 指向 Thread_T 结 构 的 一 个 隐 式 指针 ,包含 了 确定 线程 状态 的 所 有 必要 信息 。 
这 个 结构 常 称 为 线程 控制 模块 。 


(types 435)= 
struct T { 
unsigned Tong *sp; /* must be first */ 
(fields 435) 


最 初 的 字段 保存 依赖 机 器 和 操作 系统 的 数值 。 这 些 字段 首先 出 现在 Thread_T 结 构 中 ， 央 为 足 汇 
编 语言 代码 访问 它们 。 首 先 放置 它们 可 以 更 容易 地 访问 这 些 字段 ， 而 且 还 可 以 渗 加 新 字段 而 不 
用 改变 现 有 汇编 语言 代 香 。 只 有 “个 字段 ep， 大 多 数 机 器 都 需要 ， 它 保 在 了 线程 的 堆栈 指 钙 。 

大 多 数 线程 操作 都 周 绕 着 将 线程 排 人 队列 及 从 队列 中 移出 、Thread 和 Sem 接 口 设计 用 于 
维护 -个 简单 的 不 变 基 : 线程 没 在 队列 中 或 只 在 一 个 队列 中 .这 种 设计 可 以 避免 为 队列 人 吕 
分 配 任何 空间 。 比 方 说 ， 不 使 用 Seq_T 表 示 队 列 ， 相 反 用 Thread_ T 结 构 的 循环 链接 列表 表示 
队列 。 就 绪 队 列 就 是 个 例子 ， 它 保存 没有 获得 处 理 器 的 运行 线程 : 


(data 435)= 
static T ready = NULL; 





(fields 435)= 
T link; 
T *inqueue; 
图 20-3 显 示 了 就 绪 队列 中 按 A 、B 和 C 的 顺序 排列 的 三 个 线程 ready38 FA TIT BY ARIS 一 个 
REC 队列 通过 link 宁 段 链接 在 一 起 。 任 个 Thread_T 结 构 的 inqueue 字 段 指向 队列 蛮 基 — 
这 里 是 ready 一 并 用 于 删除 队列 中 的 线程 。 队 列 安 量 为 空 时 队列 为 帘 ， 正如 ready 的 初 但 所 
表明 以 及 宏 
(macros 436)= 
#define isempty(q) ((g) == NULL) 
测试 的 那样 。 
如 果 线 程 { 位 于 队列 中 ， 堵 么 t->link 和 t->inqueue 就 不 为 实 ; 耕 则 ， RAPER. FRY 
队列 函数 使 用 了 包含 iink 和 inqueue 的 断言 以 依 保 上 述 不 变量 有 效 。 例 如 ， put 把 一 个 线程 添 
如 到 一 -个 空 队列 或 非 空 队列 的 末尾 : 


(static functions 436)= 
static void put(T t, T *q) í 
assert(t); 
assert(t->inqueue == NULL && t-»link == NULL); 
if Co í 
t-»link = (*q)->link; 
(*q)->link = t; 
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} else 
t-»link = t; 
*q = t; 


t-»inqueue = q; 
) 
AEE, put(t, &ready) 把 t 漆 加 到 就 绪 队 列 木 尾 。put 接 收 队列 变量 的 地 址 ， 这 样 它 就 可 以 进行 


修改 :调用 put(t, 多 q) 后 ，q 等 了 Tt 有 ->inqueue 等 于 &q、 
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get 从 给 定 队 区 中 删除 第 一 个 元 素 ; 


(static functions 436)+= 
static T get(T *q) { 
Tt; 


assert(lisempty(*q)); 
t = (*q)->link; 
if (t == *q) 
*q = NULL; 
else 
(*q)->link = t->link; 
assert(t->inqueue == q); 
t->link = NULL; 
t->inqueue = NULL; 
return t; 
3 
这 段 代码 使 用 inqueue 字 段 确保 线程 的 确 在 q 中 ， 而 且 它 清除 了 link 和 inqueue 字 段 将 线程 标记 
为 不 在 任何 队列 。 
第 三 个 也 是 最 后 - -个 其 列 函 数 从 队列 中 线程 出 更 的 位 着 删除 该 线程 ; 


(static functions 436}= 
Static void delete(T t, T *q) { 
T p; 


assert(t->link && t->inqueue == q); 
assert(!isempty(*q)); 
for (p = *q; p->link != t; p = p->link) 





if (p == t) 


*q = NULL; 
else { 
p-»link = t->link; 





t->link = NULL; 
t->inqueue = NULL; 
H 


第 一 个 断言 确保 t 在 中 ; 第 二 个 确保 队列 非 空 ，! 在 队列 中 后 队列 必须 非 空 。 计 语句 处 再 (是 q 
中 惟一 线程 的 情况 。 
Thread_init@i@ "HR" RE ( 根 线程 的 Thread_T 结 构 足 静态 分 配 的 ); 


(thread functions 438)= 
int Thread init(int preempt, ...) í 
assert(preempt == 0 || preempt == 1); 
assert(current NULL) ; 
root.handle - &root; 
current - &root; 
nthreads - 1; 
if (preempt) { 
(initialize preemptive scheduling 454) 





J 
return 1; 


} 


(data 435)+= 
static T current; 
static int nthreads; 
static struct Thread T root; 


(fields 435) 
T handle; 

curTent 是 当前 占据 处 理 器 的 线程 : nthreads 是 已 有 线程 数 . Thread_new 逐 1 递增 
nthreads ; Thread_exit 逐 1 递 碱 。handle 字 段 仪 指向 线程 句柄 并 帮助 检查 句柄 的 有 效 性 ; 
仅 当 t 等 于 t->handle 有 t 确 定 一 个 已 有 线程 

如 果 current 为 空 ， 就 还 没有 调用 Thread_init ， 央 此 ， 如 上 所 办 ， 对 空 current 的 检测 实现 
了 Thread_init 必 须 只 调用 一 次 的 可 检查 的 运行 期 错误 。 检 查 具 他 Thread 和 Sem 函 数 中 的 非 宗 
current 实 现 fThread_init 必 须 在 其 他 任何 Thread 、Sem 和 Chan 函 数 之 前 调用 的 可 检查 的 运行 
期 错误 。Thread_self 是 个 范例 ， 它 仅 返 回 current ; 


(thread functions 438)+= 
T Thread_self(void) í 
assert(current); 
return current; 

















438 
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REZAR Z- SRL, RR ARS, BARRA CAM 
堆栈 和 异常 状态 、 上 下 文 开 关 原 证 有 众多 可 能 的 设计 . 所 有 这 些 都 相对 很 简单 ， 因 为 它们 部 
是 全 部 或 部 分 用 汇编 语言 编 气 的 。Thread 实 现 使 用 了 有 具体 于 实现 的 单一 原 语 


(prototypes 439)= 
extern void _swtch{T from, T to); 


FMM £& from 切换 到 线程 re ， 这 里 from 和 to 足 指 癌 Thread_T 结 构 的 指针 。_swtch 与 
setjmp 和 longjmp 一样 ， 当 线程 A 调 用 _swtch 时 ， 假 定 控制 转移 给 线程 B B 调用 _swtch 让 A 
重新 开始 时 ，A 对 _swtch 的 调用 就 返回 了 。 这样 ，A 和 B 部 把 _swtch 完 全 当 作 另 一 函数 调用 。 
这 个 简单 的 没 计 也 是 利用 了 机 器 的 测 用 顺序 ， 这 非常 有 帮助 ， 例 如 它 有 助 二 在 A 切 模 到 B 旱 
保存 A 的 状态 ,惟一 的 不 足 就 是 创建 的 新 线 秘 必 须 共 有 一 个 状态 ,看 上 去 好 像 调 用 了 _swteh， 
因为 第 -- 次 它 运 行 的 时 伐 会 被 作为 _swtch 中 return 的 结果 。 

-swtch 只 能 在 -个 地 方 调用 ， 即 静态 函数 run : 

(static functions 436)+= 


static void run(void) { 
T t = current; 











current = get(&ready); 
t-»estack = Except stack; 
Except stack - current-»estack; 
—swtch(t, current); 
H 
(fields 435)+= 
Except Frame *estack; 
run JA M Put r AGER Fe UJ P408] A D PL ATER FR. Toe Fi f PE ready P Mk, ib E 
current ， 并 切换 到 新 线程 。estack 宰 段 保 存 着 指向 位 十 线程 异常 堆栈 顶部 的 异常 结构 的 指针 ， 
而 日 ran 注意 更 新 Except 的 全 局 Except_stack , 4.235 i rR r z+ E: 
可 以 引起 上 下 文 切 换 的 所 有 Thread 和 Sem K SARs fr] rum , ii EL 在 调用 run 之 前 将 当 
前 线程 兽 入 ready 或 另 一 适当 的 队列 。Thread_pause 是 个 最 简单 的 例子 : 它 将 current 泗 入 
ready ， 然 后 调用 run 。 


(thread functions 438)+= 
void Thread pause(void) { 
assert(current); 
put(current, &ready); 
rund); 








H 
如 果 只 有 一 个 线程 在 运行 ，Thread_pause 就 把 它 壮 和 ready , firun HUN BRIE UH Blk 
个 线程 。 这样 _swtch(t, 口 必 须 正常 工作 。 图 20-4 描 述 了 执行 如 下 调用 的 线程 A，B 与 C 之 癌 
的 上 下 文 开 关 ， 假 定 A 最 先 占有 处 理 器 且 ready 按 顺序 保 企 B 和 C 。 
A B C 
Thread. pause() Thread pause() Thread pause() 


Thread join(C) Thread, exit(0) Thread exit(0) 
Thread. exit(0) 
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时 间 A B N 
| [B Cl 
Thread_pauseQ) `A 
—swtchCA, B) l eal 
Thread_pause() B 
_swtch(B, C) | n 
Thread_pause() 
[r a _swtch(C, A) 
Thread. join(C) ICI 
—swtch(A, B) 
Thread. exit(0) Ul 
swtch(B, C) 
Thread exit(0) 
[E —Swtch(C, A) 
` 
Thread exit(0) 
exit(0) 


K20-4. 一 个 线程 之 问 的 了 下 文 切换 


图 20-4 中 的 牌 直 实 线 箭头 表示 的 是 每 个 线程 都 拥有 处 理 器 时 的 情况 ， 水 平 虚线 箭头 外 上 
下 文 开关 ; MAW ATE SR A WIA HE. Thread 函数 太 牙 引起 的 .swtch 询 用 出 现 
每 个 上 下 文 开关 的 下 面 。 

当 A 调 用 Thread_pause 时 ， 就 将 它 放 人 ready ， 并 山 除 B ， 然 后 B 获 得 处 理 器 。 当 B 运行 的 
时 候 , ready (RAC. A. YB FHTbread. pauseti. 就 从 ready 中 删除 5 ， 然 后 C 获 得 处 理 器 ， 
Teady 保 存 A、B 。C 调 用 Thread_pause 之 后 .ready 开 次 保存 B C. MA 行 。 当 A 调用 
Thread_join(C)， 它 肉 C 的 结束 而 阻塞 ， 因 此 处 理 具 交付 给 ready 中 的 第 一 信 

此 时 ，ready 中 只 有 C ， 因 为 A 位 于 C 的 相关 队列 中。 当 B 调用 Thread_exit 时 ，run 切 换 到 C 
且 ready 为 空 。C 调 用 Thread_exit 而 结束 运行 。 这 使 得 A 作为 C 的 结束 结果 被 放 加 到 ready 中。 
这 样 ， 当 Thread_exit 调 用 runHj ，A 获 得 处理 器 、 但 是 . A 调用 Thread_exit 不 会 引起 上 下 文 转 
换 : A 是 系统 中 的 惟一 线程 ,隐藏 Thread_exit 调 用 exit。 

当 ready 为 空 且 调 用 了 run 时 发 生死 锁 ; 也 就 是 说 ， 没 有 运行 中 的 线程 。 死 锁 是 个 可 检查 
的 运行 期 错误 ， 当 空 的 就 绪 队 列 调用 get 时 能 够 检测 到 死 锁 - 

Thread_join 和 Thread_exit 描 述 了 包含 “加 人 队列 ”的 队列 操作 和 就 绪 队 列 ， 有 黄种 样式 
的 Thread_join: Thread_join(t) 等 待 线程 t 结 来 并 返回 t 的 退出 码 传递 给 Thread_exit 的 信 
t; t 一 定 不 能 是 调用 线程 .Thread _join(NULIL) 等 待 所 有 线程 线束 并 返 品 0; 只 有 一 个 线程 可 
以 调用 Thread_join(NULL) 。 









(thread functions 43845 
int Thread join(T t) { 
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assert(current && t !- current); 
testalert(); 
if (C € 
(wait for thread t to terminate 442) 
} else { 
(wait for all threads to terminate 443) 
return 0; 
i 


了 
如 下 所 述 ， 如 果 调 用 线程 被 敬告 testalert i23] Thread Alerted, Mees NEA 
有 线程 ， 调 用 线程 就 把 自身 放 人 (的 合并 队列 中 等 待 它 的 消亡 : 否则 ，Thread_join 立 刻 返 回 -1 。 
(wait for thread t to terminate 242)« 
if (t->handle == t) { 
put(current, &t->join); 
rund); 
testalertO ; 
return current->code; 
else 
return -1; 


(fields 435)+= 
int code; 
T join; 
FUfft handle FFR AR EUR AERE, WP AT aS, HRF ATR Thread. exitif li handle ^E EE, 
当 ! 结 束 时 ，Thread_exit 在 把 那些 线程 移 到 就 绪 队 列 的 同时 ， 将 它 的 参数 保存 在 Fr>join 中 每 个 
Thread 了 的 code 字 段 中 -这 样 ， 当 那些 线程 再 次 执行 的 时 候 ， 就 可 以 方便 地 状 得 那个 退出 码 了 、 
当 t 为 帘 时 ， 调 用 线程 放 人 join0，join0 保 存 着 等 待 其 他 所 有 线程 结束 的 那个 惟 -线程 : 
(wait for all threads to terminate 443)= 
assert(isempty(join0)); 
if (nthreads > 1) { 
put(current, &joind); 
run(); 


testalert(); 
了 


(data 435)+= 
static T join0; 
下 次 滑 用 线程 运行 的 时 候 ， 它 就 是 惟 -- 存 在 的 线程 。 这 段 代码 也 处 理 调 用 线程 是 系统 中 惟一 
线程 时 的 情况 ，nthreads 为 1 时 发 生 这 种 情况 。 
Thread_exit 需 要 完成 大 圭 的 工作 : 它 必 须 释 放 与 调用 线程 相关 的 资源 ,重新 运行 等 待 沿 
用 线程 结束 的 线程 并 安排 它们 获取 退出 码 ， 以 及 检查 调用 线程 是 从 为 系统 的 倒数 第 一 个 成 最 
后 一 个 线程 ， 


(thread functions 438)+= 
void Thread exit(int code) { 
assert(current) ; 
release(); 
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AO 
if (current !- &root) { 
current-»next = freelist; 
freelist - current; 
H 


current->handle = NULL; 
(resume threads waiting for current’s termination 444) 
(run another thread or exit 444) 


} 


(fields 435)+= 
T next; 
(data 435H= 
static T freelist; 
对 release 的 调用 及 把 current 附 加 到 freelist 林 尾 的 奢 段 代码 共同 合作 释放 调用 线程 的 资源 ， 下 
面 将 详细 叙述 。 如 果 调 用 线程 为 根 线程 ， 它 的 存储 空间 一 定 不 能 冬 放 ， 央 为 灶 部 分 空间 是 静 
BMR 
WPRhandleF ARLE HRI AA AEEA, LAE q 
(resume threads waiting for current's termination 444)= 
while (!isempty(current->join)) { 
T t = get(&current->join) ; 
t-»code = code; 
put(t, &ready); 


线程 现在 可 以 重新 开始 了 





} 
调用 线程 的 退出 码 被 复制 到 等 待 线程 中 Thread_T 结 构 的 code 宁 段 ， 这 样 就 可 以 释放 current 了。 
如 果 仪 有 两 个 线 释 昌 其 中 一 个 在 join0 中 那么 那个 等 待 线程 现在 可 以 重新 开始 了 。 
(resume threads waiting for current's termination 444)+s 
if (lisempty(join0) && nthreads == 2) í 


assert(isempty(ready)); 
put(get(&join0), &ready); 


断言 有 助 于 检测 维护 nthreads 和 ready 过 程 中 的 错误 ， 如 果 join0 非 空 目 nthreads 为 2， 那 么 
ready 必 须 为 空 ， 因 为 两 个 现存 线程 中 的 一 个 位 十 join0， 且 另 一 个 在 执行 Thread_exit。 
Thread exit 以 nthreads 递 减 并 调用 库 函 数 exit 或 运 1i 一 线程 作为 结束 ; 
(run another thread or exit 444)= 
if (--nthreads == 0) 
exit(code); 
else 
run(); 
Thread_ailert 在 线 稳 的 Thread_T 结 构 中 设置 标志 ， 而 且 ， 如 果 线 得 位 于 队列 中 ， 就 从 队 
列 中 删除 它 ， 从 而 将 线程 标记 为 alerted". 
(thread functions 438)+= 
void Thread_alert(T t) { 
assert (current); 
assert(t && t->handle == t); 
t-»alerted = 1; 
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if (t->inqueue) { 
delete(t, t->inqueue); 
put(t, &ready); 


H 
(fields 43545 
int alerted; 
Thread_alert 本 身 不 能 引发 Thread_Alerted ， 因 为 调用 线程 的 状态 与 1 不同 .线程 必须 引发 
Thread_Alerted 并 自己 解决 .这 就 荐 testalert 的 目的 : 


(static functions 436}4= 
static void testalert(void) { 
if (current->alerted) { 
current->alerted = 0; 
RAISECThread Alerted) ; 


了 
(data 435)+= 
const Except T Thread Alerted = { "Thread alerted" ); 
无 论 何 时 ， 只 要 线 称 被 阻塞 或 阻塞 之 后 重新 开始 WÑ IBJPHtestalert. © Thread_join JF 
始 的 调用 testalert 说 明了 前 面 那 种 情况 ;后面 一 种 情况 常 发 生 在 调用 run 之 后 ， 代 玛 块 <weit 
for thread t to terminate 442» Sli«wait for all threads to terminate 443> 中 的 testalert 调 用 对 这 
种 情况 进行 了 说 明 。Sem_wait 和 Sem_signal 中 出 现 了 类 似 的 用 法 ; 参见 20.3.5 节 。 








20.3.3 ”线程 创建 与 上 下 文 转 换 


最 后 一 个 Thread 函 数 是 Thread_new 。 一 些 Thread_new 是 依赖 于 机 器 的 ， 因 为 它 与 swtch 交 了 工 ， 
但 是 大 多 数 几 乎 部 明 独 立 于 机 器 的 。Thread_new 有 四 项 任务 ; 为 新 线程 分 配 资源 ; 初始 化 新 线程 
的 状态 ， 这 样 它 就 可 以 通过 _swtch 的 返回 开始 运行 ; 递增 nthreads 以 及 将 新 线程 附加 到 ready 末 尾 。 


(thread functions 438)+= 
T Thread new(int apply(void *), void *args, 
int nbytes, ...) í 
Tt; 


assert(current); 
assert(apply); 
assert(args && nbytes >= 0 || args == NULL); 
if (args == NULL) 
nbytes = 0; 
(allocate resources for a new thread 446) 
t-»handle = t; 
(initialize t's state 449) 
nthreads++; 
put(t, &ready); 
return t; 
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# k Thread fy MARR KAN, — PRE EM E VEI AL Thread, T£ fy fI — PER. 
Thread T 结 构 和 一 个 16K 字 节 的 堆栈 都 是 在 .次 网 用 Mem 的 ALLOC 中 分 配 的 ， 


(allocate resources for a new thread 446)= 
t 
int stacksize = (16*1024«sizeof (*t)+nbytes+15)&-15; 
release(); 
(begin critical region 447) 
TRY 
t = ALLOC(stacksize) ; 
memset(t, 'N0', sizeof *t); 
EXCEPT (Mem. Failed) [546] 
t = NULL; 
END. TRY; 
(end critical region 447) 
if (t == NULL) 
RAISE(Thread Failed); 
(initialize t's stack pointer 448) 





H 


(data 435) 
Const Except. T Thread Failed = 
{ "Thread creation failed" }; 


NBR A, A APL RRE A, JU BAY E - 定 丰 能 中 斯 hread 丽 数 的 调 
用 。 两 种 机 制 共同 合作 维护 这 个 不 变量 : -个 如 下 所 述 .处 理 榨 制 位 于 Thread PARP AL GSP i 
3j 个 机 制 处 理 当 控制 位 于 Thread 两 数 调用 的 例 穆 时 的 中断 ， 对 ALLOC 和 memset 的 调用 就 赔 明 
了 这 种 情况 。 这 些 各 种 各 样 的 调用 者 被 通过 递增 和 递减 critical 确 定 临 办 区 的 代 但 块 括 在 一起 ， 


(begin critical region 447)= 
do ( critical++; 





(end critical region 447)= 
critical--; } while (0); 


(data 435)+= 
static int critical; 
如 20.3.4 节 中 所 示 ， 忽 略 critical 非 零 时 发 生 的 中 断 
Thread_new 必 须 捕捉 Mem_Failed ， 并 在 完成 临界 区 之 后 引发 它 的 异常 Thread_Failed . 
如 果 它 没有 捕捉 这 个 异常 、 就 会 将 控制 传递 给 汕 用 者 的 异常 管理 洛 ， 疾 将 critical 设 为 水 不 弟 
减 的 一 个 止 数 ， 
Thread_-new 假 定 玲 栈 向 低 端 地 址 发 展 ， 并 像 图 20-5 中 所 示 那 样 初始 化 sp 字段 ; 项 部 的 阴 
影 框 是 Thread_T 绪 构 ， 底 部 的 那个 是 args 的 曾 本 以 及 初始 帧 ， 旭 下 所 忆 - [447] 
(initialize t's stack pointer 448)= 
t->sp = (void *)((char *)t + stacksize); 


while ((Cunsigned long)t-»sp)&15) 
t->sp--; 











448 








324 #20% 










































































































































































args 











图 20-5 Thread T£&fJ T HE RGM) e 


赋予 stacksize 的 值 以 及 这 段 代码 表 时 ，Thread_new 补 始 化 玲 栈 指针 ,将 它 的 序列 恰 限 设置 为 
16 宁 节 ， 这 对 大 多 数 平台 者 适用。 人 和 多数 机 器 部 需要 4 宁 节 或 8 字 节 的 堆栈 序列 ， 俱 是 DEC 
ALPHA 需 要 16 字 节 的 序列 。 

Thread_new 从 调用 release 开 始 ，Thread_exit 也 调用 这 个 蚌 数 。Thread_exit 不 能 释放 当前 
线程 的 堆栈 ， 因 为 它 止 在 使 用 这 个 堆栈 。 因 此 ， 它 把 这 个 线程 句柄 深 加 到 freelist ， 并 将 释放 
1 作 延 迟到 下 次 调用 release 的 时 候 ; 

(static functions 436)+= 

static void release(void) { 
Tt; 

tbegin critical region 447) 

while ((t = freelist) != NULL) ( 
freelist = t-»next; 
FREECt) ; 

} 

(end critical region 447) 

} 
release EAEN, KARAM RMA: freelist 仪 有 一 个 元 素 、 因 为 Thread_exit 和 
Thread_new 部 要 调用 release 。 如 果 仪 有 Thread_new 调 用 过 release ， 处 广 的 Thread_T 就 会 在 
freelist 堆 积 。release 使 用 临界 区 ， 因 为 它 归 调用 Mem 的 FREE , 

其 次 ，Thread_new 初 始 化 新 线程 的 堆栈 以 保存 日 args 开 始 的 nrbytes 字 节 副 本 以 及 要 将 线 
程 吕 示 成 好 像 已 经 调用 过 swtch 所 需 归 的 结构 帧 ; 后 TOO ak ea LL 

(initialize t's state 449)= 

if (nbytes > 0) í 
t->sp -= ((nbytes + 15U)&15)/sizeof (*t->sp); 
(begin critical region 447) 
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} 


memcpy (t->sp, args, nbytes); 
(end critical region 447) 
args = t->sp; 


#if alpha 
{ (initialize an ALPHA stack 463) } 
#elif mips 
{ Unitialize a MIPS stack 461) Y 
#elif sparc 
{ (initialize a SPARC stack 452) } 
*else 
Unsupported platform 
fendif 


20-5 EF PUE ME ER RBH E Yk He RI T f BU ASRI: BE READ D] RÀ ARR BJ B: ORR T LRS BJ 55 38 
WM PR MR args tial Ac, thread.cAlswich.s de 7p Bh MEHL PEMD Pene — BER. 
融会 贵 通 _swtch 的 汇编 语 吉 实现 之 后 ， 堆 栈 的 初始 化 就 更 易于 理解 了 : 


(switch. s)= 
#if alpha 
(ALPHA swtch 462) 
(ALPHA startup 463) 
#elif sparc 
(SPARC swtch 450) 
(SPARC startup 452) 
#elif mips 
(MIPS swtch 460) 
(MIPS startup 461) 
#else 
Unsupported platform 
#endif 


Switch (from, to ) 必须 保存 from 的 状态 ,恢复 to 的 状态 ， 并 从 to 的 能 近 -次 调用 返回 到 


-swtch 以 继续 执行 fo。 调用 规范 保存 了 大 部 分 状态 . 
些 寄 存 器 值 ， 但 不 用 保存 条 件 码 这 样 _- 些 机 器 状 






因为 通常 它们 规定 必须 保存 调用 中 的 一 
&. 内 此 ，_swtch 仅 保存 了 它 





受 调用 规范 支持 的 状态 一 例如 返回 地 此 一 一 而 几 可 以 在 调用 线程 的 堆栈 中 保存 这 些 值 。 
SPARC swtch 可 能 是 最 容易 的 ,因为 SPARC 调 用 规范 要 给 每 个 函数 提供 它 自己 的 “ 寄 
存 器 窗口 ”以 保存 所 有 的 寄存 器 ;， 它 惟一 必须 保存 的 寄存 器 是 帧 指针 及 返回 地 过。 


(SPARC swtch 450)= 


NDOU bwe 


-global 
„align 
.proc 
—swtch: 


一 Swtch 


%sp , - (8464) ,%sp 
%fp, [%sp+644+0] — save froms frame pointer 
3617, [%sp+64+4] — ! save from's return address 


3 ! flush from's registers 
%sp, [9510] ! save from's stack pointer 
[Xi1],Xsp ! load to's stack pointer 


[%sp+64+0] ,%fp ! restore to's frame pointer 





449 








450 














451 








326 #208 





8 ld [%sp+64+4],%i7 — ! restore to's return address 
9 ret ! continue execution of to 
10 restore 


上 面 的 行 编导 用 于 确定 下 面 其 体 说 明了 所 针对 的 非 样 本 行 ， 它 们 不 局 于 汇编 语言 代码 。 根 据 管 

XE, 汇编 语言 名 称 邦 以 下 划 线 作为 前 经 、 天 此 在 SPARC 的 汇编 语言 中 _swteh 就 称 为 swtch 。 
图 20-6 显示 了 _swteh 的 邮 结 构 ， 所 有 的 SPARC 帧 硕 部 至 少 有 64 字 节 供 据 作 系统 在 必要 

的 时 候 企 储 寄存 器 窗口 : -swtch72 字 节 帧 中 的 另 两 个 字 存 放 的 是 已 有 的 帧 指针 和 返回 地 十 , 








M— - %Sp 
| 64 Rw 216 个 学 
“Th Ese le 一 %sp+64 
ELT e %sp+68 











20-6 _swteh 堆 栈 帜 的 布局 


swtch 中 行 1 为 -swtch 分 配 了 堆栈 帧 。 行 2 和 行 3 保存 from W ofp ) 并 返回 新 帧 中 
第 17 和 18 个 32 位 字 ( 偏 移 基 位 64 利 |68 ) 中 的 旧址 ( %i7 )。 行 4 执行 了 -个 系统 调用 将 from 的 
寄 仓 器 窗 口 “ 冲 刷 ” 到 堆栈 ， 为 了 能 够 继 继 运行 to 的 窗 存 器 窗口 这 是 必要 的 。 这 个 调用 效果 
不 好 ;用 户 级 线程 几 个 假定 的 优点 之 一 就 是 上 下 文 切换 不 需要 核心 起 需 。 但 是 在 SPARC 嘴 
只 有 核心 可 以 出 洗 寄存 器 窗口 , 

行 5 将 from 的 堆栈 指针 保存 在 它 Thread_T 结 构 的 sp 宁 段 中 ， 该 指令 说 明 了 为 什么 那个 字段 
要 在 第 -位 :这 段 代码 独立 于 Thread_T 的 大 小 及 其 他 字段 的 位 置 。 行 6 中 斜体 字 因 为 它 是 突 
际 的 上 下 文 开关 ,这 条 指令 把 to 的 堆栈 指针 装 载 到 ssp, HEAR THETE EHE. RIG. _swtch 在 to 
的 堆栈 上 执行 。 行 7 和 行 8 恢复 to 的 帧 指针 并 返回 地 址 ， 内 为 %sp 现 在 指 问 to 堆栈 的 硕 端 49 
和 行 10 包 含 了 正常 的 晒 数 返回 顺序 ， 旦 入 制 继续 位 于 io 最 后 一 次 调用 _swtch 时 保存 的 地 二。 

Thread_new 必 须 为 swtch 创 建 巅 ， 这 样 其 他 一 些 对 _swtch 的 沿用 可 以 正确 返回 并 开始 运 
行 新 的 线程 ， 沪 运 行 必 须 调用 apply 。 几 20.7 品 示 JThread_new 所 建立 的 内 容 ，_swtch 的 帧 
在 堆栈 顶端 帧 下 面 就 是 如 下 的 启 功 代 偶 。 











(SPARC startup 452)= 
-global _ start 
.align 4 
proc 4 
1 —start:ld [%sp+64+4] ,%00 
2 Vd [%sp+64] , %01 
3 call %ol; nop 
4 call —Thread_exit; nop 
5 unimp 0 
-global _ ENDMONITOR 
——ENDMONITOR : 


-swtch ti pág 3& PT gh hr 38 [5], start, Ti HW HK apply Margs ， 如 图 20-7 所 示 。_swtch 第 - 
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次 返回 时 ， 榨 制 到 达 _start (这 足 汇 编 代码 中 的 _start )、 启 动 代码 的 行将 args E RA %o0 , 
根据 SPARC 调用 规范 ，%o00 用 村 传递 第 一 个 参数 。 行 2 把 apply 的 地 由 装载 到 %o1， 其 他 时 候 
者 不 使 用 %o1;， 行 3 间接 调用 了 apply 。 如 果 upply 返 区 ， 它 的 退出 码 就 会 在 %o0 中 、 这 样 共 
中 的 竺 就 会 传 给 从 不 返回 的 Thread_exit。 行 5 应 当 永 不 执行 ;如果 执行 就 会 引起 一 个 错误 。 
下 而 名 ENDMONITOR 进 行 了 说 明 。 
—Swtch 和 _start 中 的 这 15 行 汇编 语 站 忠 SPARC 上 需要 的 全 部 内 容 ;如 图 20-7 中 所 示 孝 样 
初始 化 新 线程 的 堆 钱 可 以 完全 用 C 实 现 。 如 下 所 天 ， 这 两 个 帧 部 是 从 下 往 上 建立 的 。 
(initialize a SPARC stack 452)= 
l dnt i; void *fp; extern void -start(void); 
2 for G = 0; i «8; i+) 
3 S--t->sp = 0; 
+ “*--t->sp = (unsigned Tong)args: 
5  *--t-»sp = (unsigned long)apply; 
6 t->sp -= 64/4; 
7 fp = t->sp; 
8 *--t->sp = (unsigned long) start - 8; 
9  *--t-»sp = (unsigned long)fp; 
l 









































O t-»sp -= 64/4; 
* M—  -Xsp 
16 个 字 
_swtch Bi 
I 
和 十 一、 
j 一 Start-8 1 
i - |. Z 
16 VF 
i 
aá 1— 
apply 
args LEN 
Sy 
* | Z 
1120-7, SPARC EIU SAIDIA sicht 
行 2 和 行 3 在 启动 帜 底部 创 建 [8 个 字 。 行 4 和 行 5 把 args 和 apply 的 值 推 人 堆栈 ; 行 6 在 启动 赂 
的 顶部 分 配 了 64 字 节 ， 这 个 地 方 的 堆栈 指针 是 _swtch 必须 恢复 的 机 指针 、 因此 行 7 把 这 个 值 
保存 在 各 路 。 行 8 将 返回 地 址 一 一 %i7 中 保存 的 值 排 人 堆栈 . 返回 地 址 是 _start 前 而 的 8 个 字 节 ， 








452 
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FA SPARC ret 指 令 在 返回 时 间 名 这 中 的 地 址 加 了。 行 9 将 % 印 中 保 企 的 值 推 人 堆栈 ， 行 10 
以 _swtch 帧 项 端的 64 个 字 节 作为 结 

如 果 apply 是 个 接收 不 定 基 参数 的 函数 ， 它 的 人 口 顺 序 就 将 党 00 诗 驶 o5 中 的 值 保 在 到 堆 
栈 调 岂 方 巾 即 启动 巾 的 偏 移 64 至 88 的 位 置 . 行 2 利 行 3 用 于 分 配 这 段 空 间 及 另外 的 8 个 字 节 ， 
这 举 堆 栈 指 针 保 持 按 8 字 节 的 界限 排列 ， 参 见 SPARC 硬 件 说 明 -。 

MIPS 和 ALPHA 版 本 的 swtch 和 _start 将 在 20.3.6 中 介绍 。 


203.4 抢占 


抢占 相当 于 定期 隐 式 调用 Thread_pause . 依 束 于 UNIX 的 Thread 抢 占 实现 安排 了 -个 
“虚拟 的 ”定时 者 每 50 毫 秒 中 断 次， 中断 管理 器 就 执行 等 价 于 Thread_pause 的 代码 定时 
SEMIN, AA Ae DU RABY ALE. Thread .init 使 用 UNIX 信 号 工具 初始 化 定 
时 器 的 中 断 信号 。 第 一 步 把 中 断 管理 器 与 虚拟 时 钟 信号 SIGVTALRM 关 联 起 来 : 

(initialize preemptive scheduling 4s4)- 

struct sigaction sa; 

memset(&sa, '\O', sizeof sa); 

sa.sa_handler = (void (*)O)interrupt; 

if (sigaction(SIGVTALRM, &sa, NULL) < 0) 
return 0; 


} 
sigaction 结 构 有 二 个 字段 : sa_handier 足 产生 SIGVTALRM 信 号 时 所 调用 函数 的 地 址 ; 
sa_mask 是 一 个 信号 集 ， 用 于 指定 处 理 中 断 时 应 当 阻 硅 的 芯 他 信 咏 ，SIGVTALRM 除 
sa_flags 提 供 具 体 于 信和 号 的 选项 ， 如 下 所 述 ， Thread_init 把 sa_handler 设 yinterrupt ， 并 清空 
其 他 字段 。 
sigaction 暗 数 是 用 于 关联 管理 器 与 信号 的 POSIX 标 准 函 数 。POSJX 标 准 得 到 了 大 多 数 UNIX 
变 体 及 Windows NT 这 样 的 其 他 - - 些 操作 系统 的 支持 。 这 一 个 参数 都 作为 符号 名 ， 分 别 表示 信 
号 数 、 指 向 修改 该 信号 行为 的 sigaction 结 构 的 指针 以 及 指向 男 一 个 没有 用 该 信号 前 行为 进行 
填充 的 sigaction 结 构 的 指针 。 当 第 参数 为 空 时 ， 就 厅 再 返回 前 一 行为 的 相关 f. 
如 果 信号 的 行为 被 修改 为 第 二 个 参数 所 指定 的 部 样 , sigaction ALR BEES SAER- 
如 果 sigaction 返 回 -1 Thread init Mik HS, WRB E SUI Be RATA SEAR 的 调度 ， 
一 旦 信和 号 管理 器 就 位 ， 虚 拟定 时 器 就 得 到 了 初始 化 : 
(initialize preemptive scheduling 454)+= 
1 


struct itimerval it; 














it.it value.tv sec 20; 
it.it value.tv usec = 50; 
it.itointerval,tv sec = 0; 
jt.it_linterval.tv_usec = 50; 


if (setitimerCITIMER_VIRTUAL, &it, NULL) « 0) 
return 0; 
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itimerval 结 构 的 it_value 宁 段 以 秒 (tv_sec ) 和 毫秒 (tv_msec ) 指定 下 次 定时 器 中 断 的 时 间 
长 度 。it_interval 字 段 中 的 数值 用 于 定时 器 过 期 时 重新 设置 itL_value 字 段 。Thread_init 安 排 定 
时 器 中 断 舍 50 毫 秒 发 生 一 次 

setitimer 函 数 很 像 sigaction MM: 它 的 第 一 个 参数 指定 对 哪个 定时 器 的 行为 起 作用 ( 也 
有 实时 的 定时 器 ) ; 第 二 个 参数 是个 指针 ， 指 向 存放 新 定时 器 值 的 itimerval 结 构 ， 第 二 个 参 
数 也 是 个 指针 、 指 向 获取 前 一 定时 器 值 的 itimerval 结 构 ， 个 如 果 不 需 要 前 而 的 这 个 值 就 
如 果 成 功 设置 定时 器 ，setitimer 就 返回 零 ; 否则 返回 -1。 

瞄 拟 定时 器 过 期 的 时 候 就 调用 信和 号 管理 器 interrupt。interrupt 返 回 的 时 候 就 会 解除 中 断 ， 
这 时 定时 器 就 重新 开始 。interrupt 运 行 相 当 于 Thread_pause 的 两 数 ,除非 当 前 线程 位 于 临界 
区 中 或 者 位 于 Thread 或 Sem 函数 中 的 菜 个 地 方 。 





(static functions 436)+= 
static int interrupt(int sig, int code, 





struct sigcontext ?scp) f 455 











if (critical || 
Scp-»sc.pc >= (unsigned long). MONITOR 

&& scp-»sc pc <= (unsigned long) ENDMONITOR) 
return 0; 

put(current, &ready); 

sigsetmask(scp-»sc mask); 

runO ; 

return 0; 


} 


Sig 和 参数 存放 信和 号 数 code A- - 些 信号 提供 另外 数据 , scp 参 数 是 个 执行 sigcontext 结 构 的 指针 ， 
这 个 结构 在 sc_pe 字 段 中 包含 了 中 断 时 候 的 单元 计数 器 。thread,c 开 始 于 空 明 数 MONITOR ; 
swtch.s 中 的 汇编 语言 代码 以 全 局 符号 .ENDMONITOR 的 定义 作为 结束 、 如 果 目 标 文件 装载 
到 程序 ， 那么 swteh.s 的 目标 代码 就 紧 随 thread.c 的 日 标 代码 ， 然 后 如 果 中 断 线程 的 单元 计数 
器 在 -MONITOR 和 _ENDMONITOR 之 间 ， 它 就 执行 -- 个 Thread 或 Sem 函 数 。 这样， 如 果 
critical 3E0 , 或 scp->sc_pc 位 于 _MONITOR fi ENDMONITOR Z fi] , interrupt 就 返回 并 忽略 
这 次 定时 器 中 断 。 否 则 ， 中 断 就 将 当前 线程 推 人 ready 并 运行 另 -线程 。 

调用 sigsetmask 恢 复 由 断 禁 用 的 信 生 集 scp->sc_mask 中 提供 的 信人 ;这 个 集合 通常 仅 在 
放 SIGVTALRM 信 号 。 这 个 商用 很 必 烛 ， 因 为 下 个 运行 的 线程 可 能 还 没有 被 中 断 挂 起 。 例 如 ， 
假设 线程 A 明确 调用 了 Thread_pause ， 执 行进 展 到 线程 B 。 发 上 定时 器 中 断 时 ， 控 制 到 达 
interrupt， 并 禁用 了 SIGVTALRM 信 和 叶 。B 重 新 启用 了 SIGVTALRM 并 将 处 惠 器 释放 给 A。 

如 果 省 略 了 sigsetmask 的 调用 ,A 肯 次 运行 的 时 候 SIGYTALRM 仍 会 是 禁用 的 。A 被 
Thread_pause 而 不 是 interrupt 持 起。 下 次 定时 器 中 断 发 生 时 ,A 被 排 起 而 B 继 续 。 这 种 情况 下 。 
调用 sigsetmask 呈 多余 的 ， 央 为 B 解 除 广 这 个 小 断 ， 恢 复 了 信号 抢 码 。Thread_T 结 构 中 的 一 
个 标志 可 用 于 避免 对 sigsetmask 的 不 必要 调用 。 

中 断 管理 器 的 第 一 个 帮 其 后 的 参数 是 受 系统 影响 的 。 大 多 数 UNIX 变 体 支持 上 述 的 code 





和 scp 参 数 ， 但 证 其 他 POSIX 兼 容 系统 可 能 会 问 管理 器 提供 不同 的 参数 。 456 
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203.5 一 般 信号 量 


QUIAE 3047 ENE = Ut ALD T Sem e PRE EZ I OT : 
(sem functions 457)= 
T *Sem new(int count) í 


T *s; 
NEW(s) ; 
Sem init(s, count); 
return s; 
了 
void Sem_init(T *s, int count) { 
assert(current) ; 
assert(s); 
S->count = count; 
s->queue = NULL; 
H 
Sem waitWiSem, signal Ri’), (CUE 3E "3B iE Mf X Or PAS BUR E BE SS 
基 把 作 企 语义 上 等 价 于 : 
Sem_wait(s): while (s->count <= 0) 


--$->count; 


Sem signal(s): ++s->count; 





这 
的 运行 期 错误 。 
void Sem wait(T *s) í 
while (s-»count <= 0) í 
put(current, &s-»queue); 
rund); 
1 


-~$->Ccount ; 


} 


void Sem signal(T *s) { 
if (++s->count > 0 && !isempty(s->queue)) 
put (get(&s->queue), &ready); 
) 


语法 使 如 下 所 示 的 实现 不 常 简明 而 且 止 确 ， 伺 不 合理 ; REESE LL 88 Y SEU RISI te 


这 些 实现 之 所 以 下 合理 足 因为 它们 允许 "资源 不 足 "。 假 疫 s 初始化 为 1 卫 线 程 A 和 B 都 执行 


for Gs) í 
Sem wait(s); 


Sem signal (s); 
3 
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队列 。 如 果 接 下 来 运行 B ， 它 对 Sem_wait 的 调用 将 会 返回 ，DB 将 进入 临界 区 。 但 是 A 可 能 
先 调用 Sem_wait 而 独占 临界 如果 A 在 临界 区 中 被 取代 ，B 重 新 开始 但 发 现 s->count 为 零 , 
义 回 到 s ->queue 。 没 有 某 种 干 顶 ，B 会 在 ready 和 s ->queue 之 问 无 限期 地 循环 ， 而 且 ， 更 多 线 
BR Fs ARA n| BERE RAE 
— HR RTT AR LO RA TE s ->queue 移 到 ready 时 得 到 信号 时 ， 当 s ->count 要 从 0 递增 
到 1 但 还 没有 真正 增加 时 将 线程 从 s->queue 移 到 ready 就 可 以 实现 这 种 方案 。 类 似 地 ， 阻 蜜 的 
线程 在 Sem_wait 中 重新 开始 时 不 减少 S->count _ 
(sem functions 457)+= 
void Sem wait(T *s) í 
assert(current); 
assert(s); 
testalert(); 
if (s-»count <= 0) { 
put(current, (Thread. T *)&s-»queue); 


rund); 

testalert(); 
} else 

--S-»Count; 


H 


void Sem signal(T *s) í 

assert(current); 

assert(s); 

if (s->count == 0 && lisempty(s-»queue)) { 
Thread.T t = get((Thread T *)&s->queue); 
assert(!t-»alerted); 
put(t, &ready); 

} else 
++s->count; 


H 
Zis-»count 为 零 且 线程 C 移 到 就 绪 队 列 中 时 ， 去 确保 C 得 到 信忠 景 ， 因 为 调用 Sem_watt 的 其 
Tz SEES Eds ->count 为 零 而 阻塞 。 但 是 对 于 - AMES, CRA M 648312 E M. MED EC 
BRUGEd zd Wem signal, gt usi~-2R RTECS WAR IRE S RHI TAM, 尽管 C 也 会 
得 到 信号 量 。 

告 让 Sem_wait 很 难于 理解 。 如 泉 s 中 阻 害 的 线 各 被 警告 ， 它 在 Sem_wait 中 对 mn 的 调用 
就 会 返回 ， 同 时 还 设置 了 它 的 alerted 标 志 。 这 种 情况 下 ，Thread_Alert 而 不 号 Sem_signal 将 
线程 移 到 ready ， 这 样 ， 它 的 恢复 就 5s->count 的 值 无 关 。 这 个 线程 一 定 不 能 干扰 8 ， 必须 清 
除 它 的 alerted 标 志 ， 并 引发 Thread_Alerted , 


20.3.6 MIPS 和 ALPHA 上 的 上 下 文 转换 


MIPS 和 ALPHA 版 本 的 _swtch 和 _start 在 SPARC 版 本 的 设计 方面 找 常 类 似 ， 但 是 纲 委 上 
也 有 有 不同 的 地 方 。 
MIPS 版 本 的 _swtch 如 下 所 天 、 帧 大 小 为 88 字 节 。$31,48+36($sp) 中 的 存储 指令 保 丰 “已 
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AWM TARE RAER: 寄存 器 31ff 放 返 加 地址。 斜体 指令 通过 装载 to 的 准 栈 指针 
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rs 
去 
$e 





UA FF X. mHORUS 0636383282 OR RUD. AAA PR 


(MIPS swtch 460) 
.text 
.glob] .swtch 
.align 2 
.ent _swtch 
.set reorder 
-Swtch: .frame 


nanaon 


这 里 是 MIPS 的 启动 代码 ， 


$sp,88,$31 
$sp,88 
Oxfff00000,-48 
$f20,0($sp) 
$F22,8($sp) 
$f24,16($sp) 
$126,24($sp) 
$f28,32(S$sp) 
$f30,40($sp) 
OxcOff0000,-4 
$16,48+0($sp) 
$17, 48+4($sp) 
$18, 48+8($sp) 
$19,48+12($sp) 
$20, 48+16($sp) 
$21, 48+20($sp) 
$22 ,48+24($sp) 
$23 ,48+28($sp) 
$30, 484+32($sp) 
$31,48+36($sp) 
$sp,0($4) 

$sp, 0($5) 
$f20,0($sp) 
$f22,8($sp) 
$f24,16($sp) 
$126,24($sp) 
$f28,32($sp) 
$f30,40($sp) 
$16,48«0($sp) 
$17,48«4($sp) 
$18, 48+8($sp) 
$19, 48+12($sp) 
$20, 48+16($sp) 
$21,48+20($sp) 
$22 ,48+24($sp) 
$23 ,48+28($sp) 
$30, 48+32($sp) 
$31,48+36C$sp) 
$sp,88 

$31 
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(MIPS startup 461)= 

-globl start 

_start: move $4,$23 # register 23 holds args 
move $25,$30 # register 30 holds apply 
jal $25 
move $4,52 # Thread exit(apply(p)) 
move $25,521 # register 21 holds Thread exit 
jal $25 
syscall 

.end —swtch 

-globl . ENDMONITOR 

~ENDMONITOR: 


这 段 代码 与 Thread_new 中 受 MIPS 影 响 的 部 分 代码 共同 合作 ， 并 通过 将 Thread_exit args 
Aapply 任 依 在 帆 中 的 适当 位 置 而 安 厦 它 们 分 别 显 具 在 寄存 器 21 、23 30 p. apply 的 第 一 
个 参数 传递 给 寄 作 器 4 ， 并 将 结果 返回 到 寄存 嵌 2 。 启 动 代 码 不 需要 一 个 帧 ， 因 此 
Thread_new 色 建立 一 个 _-swtch 帧 ， 但 是 它 在 堆栈 中 那个 帧 下 而 分 配 四 个 字 ， 以 防 apply 接 
收 不 定量 的 参数 , 





{initialize a MIPS stack 461)= 
extern void _start(void); 
t-»sp -- 16/4; 
t-»5sp -= 88/4; 
t->sp[(48+20)/4] = (unsigned long)Thread exit; 
t->sp[(48+28)/4] = (unsigned long)args; 
t->sp[(48+32)/4] = (unsigned long)apply; 
t->sp[(48+36)/4] = (unsigned long) start; 






TH PMIPS 的 启动 代 碍 必须 独立 于 位 着 ，Thread_exit 的 地 址 就 在 寄 在 器 21 中 传递 。 启 动 代码 
在 调用 Gate) 之 前 将 args 的 地 址 复制 到 寄 企 器 4， 并 将 apply 和 Thread_exit 的 地 址 复制 到 
寄存 器 25 ， 内 为 堵 是 MIPS 独 立 于 位 置 的 调用 顺序 所 上 归 求 的 。 

ALPHA 代 码 块 与 相应 的 MIPS 代 码 块 类 似 : 


(ALPHA swtch 462)= 

-globl _swtch 

.ent —swtch 

—swtch: lda $sp,-112($sp) # allocate _swtch's frame 
.frame $sp,112,$26 
-fmask  Ox3f0000,-112 
stt $f21,0(8sp) # save from's registers 
stt $f20,8($5p) 
stt $f19,16($sp) 
stt $f18,24($sp) 
stt $f17,32($sp) 


stt $f16,40($sp) 
.mask ^ 0x400fe00,-64 
stq $26,48«0($sp) 


stq $15,48«-8($5p) 
stq $14,48«16($sp) 
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stq $13,48+24($sp) 
stq $12 ,48+32($sp) 
stq $11,48440($5sp) 
stq $10,48448($5p) 
stq $9,48456(55p) 
.prologue 0 
stq $sp,0($16) # save from's stack pointer 
Tda $sp,0($17) # restore to's stack pointer 
ldt $f21,0($sp) # restore to's registers 
ldt $f20,8($sp) 
Idt $f19,16($sp) 
ldt $f18,24($sp) 
Idt $f17,32($sp) 
Idt $f16,40($sp) 
Idg $26,48+0($sp) 
1dq $15,48+8($sp) 
Idg $14, 48+16($sp) 
1dq $13 ,48+24($sp) 
1da $12,48«432($sp) 
dq $11,48440($5p) 
ldg $10, 484+48(Ssp) 
1dq $9,48456($sp) 
lda $sp,112($sp) # deallocate frame 
ret $31, ($26) 

.end —Swtch 

(ALPHA startup 463)= 

.globl .start 

.ent -start 

start: .frame $sp,0,$26 
.mask Ox0,0 
.prologue 0 
mov $14, $16 # register 14 holds args 
mov $15,$27 # register 15 holds apply 
jsr $26, ($27) # call apply 
1dgp $26, 0($26) # reload the global pointer 
mov $0,$16 # Thread, exit(apply(args)) 
mov $13,927 # register 13 has Thread exit 
jsr $26,(827) 
Call .palO 

.end -start 


.globl _ENDMONITOR 


—ENDMONITOR: 


(initialize an ALPHA stack 463)= 
extern void _start(vaid); 


t->sp -= 112/8; 
t->sp[(48+24)/8] 
t->sp[(48+16)/8] 
t->sp[(48+ 8)/8] 
t->sp[(48+ 0)/8] 


= (unsigned long)Thread exit; 
= (unsigned long)args; 

= (unsigned long)apply; 

= (unsigned long). start; 


t 
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参考 书目 浅 析 


Andrews (1991) 是 关于 并 行 编程 的 综合 文章 。 它 介绍 了 大 部 分 针对 于 编写 并 行 系统 的 
问题 及 解决 方案 ， 包 括 同步 机 制 、j; 统 利 远程 过 程 调用 。 它 也 介绍 了 站 种 编程 说 言 
专 为 并 行 编程 所 设计 的 特点 。 

Thread 旦 建立 在 Modula-3 之 上 的 线程 接口 ， 这 个 培 口 来 自 于 使 用 Digital 系 统 研 究 中 心 的 
Modula-2+ 线 程 工具 的 经 万 。Andrew Birrell 所 著 的 Nelson (1991) 第 4 章 介绍 了 如 何 用 线程 
编程 ; 任何 人 编写 基于 线程 的 应 用 和 序 都 能 从 这 篇 文章 中 获 益 。 大 多 数 现代 操作 系统 中 的 线 
程 工具 都 在 某 种 方式 上 基本 SRC 接口 。 

Tanenbaum (1995 ) 调查 了 用 户 级 和 核心 级 线程 的 设计 问题 ， 并 概括 了 它们 的 实现 方案 。 
他 的 个 案 研 究 介 绍 了 三 种 操作 系统 【Amoeba 、Chorus 和 Mach ) 中 的 线程 包 ， 以 及 开放 软件 
基金 会 的 分 布 式 计算 环境 中 的 线程 . Ro, DCE RBZ TB ALI MMR, ， 是 运行 在 
UNIX 的 OSP1 变 体 上 ， 但 是 现在 大 多 数 抠 作 系统 上 部 拥有 这 种 环境 ,包括 OpenVMS , OS/2, 
Windows NT X Windows 95, 

Kleiman , Shah füSmaalders (1996 ) 详细 介绍 POSIX UIS ( 电气 和 电 了 工程 胁 会 1995 ) 
和 Solaris 2 线程 。 这 本 实用 性 的 书 有 一 章 足 关 寸 线程 交互 作用 科 库 的 ， 以 及 使 用 线程 并 行 化 
算法 的 大 量 范例 ， 包 括 排序 和 列表、 队列 和 散 列 表 的 线程 安全 实现 ， 

sieve 政 编 自 一 个 类 似 的 例子 ，Mcllroy (1968) 曾 用 来 介绍 如 何 使 用 与 尤 优先 权 线 程 - 
样 的 协同 程序 进行 编程 。 几 种 语言 中 都 出 现 了 协同 程序 、 有 时 名 称 不 同 而 已 。Icon 的 协同 表 
达 就 是 个 例子 (Wampler 和 Griswold 1983). Marlin (19800 调查 了 许多 原始 的 夏 同 程序 提 
案 ， 并 介绍 了 Pascal 变 体 的 模型 实现 。 

通道 基于 CSP 一 一 通信 顺序 进程 (Hoare 1978 )。 线 程 利通 道 邦 出 现在 Newsqueak 路 ， 这 
是 一 个 应 用 的 并 行 s CSP 和 Newsqueak 中 的 通道 比 Chan 所 提供 的 更 强大 ， 因 为 这 两 种 语 
言 都 有 工具 可 以 在 多 个 通道 不 确定 地 等 待 。Pike ( 1990 ) 浏览 了 Newsqueak 的 一 种 解释 程序 
实现 的 最 重要 部 分 ， 并 介绍 了 使 用 随 宙 数 改 实 抢 占 频率 ， 便 线程 调度 变 得 不 确定 〔 位 合理 ) 
Meltroy (1990 ) 详细 叙述 了 - -个 将 短 级 数 作为 数据 流 处 理 的 Newsqueak 程 序 ， 他 的 方法 非 
BRAT RE RRE o 

Newsqueak 现 已 用 于 实现 窗口 系统 ， 它 举例 说 明了 从 线程 中 效 得 最 大 益处 的 各 种 交 开 应 
用 。NeWS 窗 口 系统 (Gosling , Rosenthal 和 Arden 1989 ) 旦 用 共有 线程 的 语 兰 所 编写 的 另 一 
个 窗口 系统 范例 。NeWS 系 统 的 核心 是 个 处 理 文本 和 网 象 的 PostScript 解 释 程序 。 大 多 数 
NeWS 徐 口 系统 本 身 就 是 用 它 包括 无 优先 权 线 程 扩 展 部 分 的 PostScript 变 体 编写 的 。 

函数 式 滞 言 Concurent ML (Reppy 1997 ) 支持 线程 和 同步 道道 移 方 式 而 像 Chan 一 些 。 
通常 用 非 命令 性 语言 比 苦于 堆栈 的 命令 性 洁 计 更 容易 实现 线程 ， 例 如 ， 在 Standard ML 中 就 
没有 堆栈 ， 因 为 激活 过 程 会 它们 的 调 悍 方 存在 的 时 间 更 长 因此，Concurrent ML 全 部 采用 
Standard ML 实现。 

使 用 MONITOR 和 _ENDMONTTOR jt € 2 Thread Sem 3: 3i uh fJ (EH A FCormack 
(1988 )， 具 中 介绍 TUNIX 线 程 的 一 个 类 似 但 稍 有 不 同 的 接 山 。Stevens (1992 ) 的 第 10 章 全 
而 论述 了 信号 种 信号 处 理 过 程 ， 它 还 介绍 了 UNIX 滨 体 和 POSIX 标 准 之 间 的 区 别 。 
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二 进 制 信号 基 一 一 通常 称 为 锁 或 互 斥 体 一 DR — Ref Bh. BT 
个 单独 的 接 !1， 它 的 实现 要 比 一 般 信号 量 的 接口 简单 。 餐 注意 敬告， 

假设 线程 4 锁定 xz， 然后 试图 锁 件 y ,同时 8 锁定 y， 然 后 试图 锁 什 +*. 这 些 线程 就 死 
BUT. 4 不 能 继续 执行 除非 B 解 着 ); 而 了 3 也 不能 运行 .除非 4 解 开 xz。 扩 展 你 在 上 题 
中 锁 的 实现 以 检测 这 些 各 种 各 样 的 简单 死 锁 。 

不 使 用 信号 量 重新 实现 thread.c 中 的 Chan 接 口 ”为 通道 设计 一 个 何 时 的 表示 法 ， 并 
直接 使 用 这 种 内 部 队列 和 线程 皮 数 ， 而 非 仿 HR. BERS. Lit EUM 
试 方法 估计 一 下 这 些 推测 起 米 可 能 效率 更 高 一 些 的 实现 的 好 处 。 基 化 对 这 个 改进 
的 实现 应 用 程序 必须 具有 的 消息 行为 的 级 别 。 

为 异步 带 缓冲 通信 设计 并 实现 一 个 接口 一 一 一 个 线程 癌 消 息 工具 ， 其 发 送 方 不 用 
等 待 消息 被 接收 ， 癌 时 消息 一 直 缓 冲 到 被 接收 为 止 : 你 的 设计 应 当 允 许 消息 存在 
的 时 闻 长 于 它们 的 发 送 线 程 所 存在 的 时 而; 也 就 是 说 ,线程 发 送出 消息 之 后 在 消 
息 被 楼 收 之 前 退出 。 异 步 通信 比 Chan 的 同步 通信 和 哆 加 储 杂 ， 因 为 它 必须 处 理 缓冲 
消息 的 存储 管理 以 及 更 多 错误 条 件 ， 例 如 ， 为 线程 提供 一 种 方式 确定 足 否 已 经 接 
Ky 条 消息 。 
Modula-3 支 持 条 件 变量 。 条 件 些 其 c 与 锁 虽 相关。 原子 操作 sieep(m, c) 使 调用 线程 
解 开 m 的 锁 并 等 待 c 。 调 用 线程 必须 锁定 m。wakeup(c) 使 -个 或 多 个 线程 等 待 c 重 
新 开始 运行 ; 其 中 之 ”- 解 开 m 并 从 它 的 调用 返回 到 sleep。broadcasttc) 与 wakeup(c) 
- 样 ， 但 是 c 上 所 有 了 睡眠 中 的 线程 重新 下 始 运 行 . 警 针对 阻塞 在 条 件 变量 上 的 线程 
不 起 作用 、 除 非 它们 调用 Talertsleep 而 不 是 sleep 。 当 一 个 调用 了 alertsleep 的 线程 
得 到 筠 告 的 时 候 ， 它 就 锁定 m 并 引发 Thread_Alerted 。 设 计 并 实现 一 个 支持 条 件 变 
基 的 接口 ;使 用 你 在 练习 20.1 中 的 锁 。 

如 果 系 统 支持 非 阳 塞 MO 系 统 调用 ， 就 用 它们 建立 一 个 C 标 准 IO 库 的 线程 安全 实现 。 
也 就 是 说 ， 如 果 一 个 线程 调 甩 getc ， 其 他 线程 可 以 在 那个 线程 等 待 输入 的 时 候 运行 。 
设计 一 种 方法 不 使 用 MONITOR 和 _ENDMONITORihThread 和 Sem 明 数 其 有 原子 
性 - 提示 : S Jal AAI, BPRS TE TS UE, TB 
代码 要 修改 这 个 标志 。 要 注意 一 一 使 用 这 种 方法 你 会 无 法 相信 那么 容易 
就 犯 下 了 一 个 细小 的 错误 。 

扩展 Thread_new ， 让 它 接 受 指定 堆栈 大 小 的 可 选 参 数 ， 例 如， 

t = Thread_new(..., "stacksize", 4096, NULL); 

ACA OR — T BAK S HER BAUR, 

1620.1 15 PPM Thread X UB HOME PY ZH. FUE Thread init 
Thread_new ， 让 它们 可 以 接受 优先 权 说 里 作为 可 选 参 数 ，Tanenbaum (1995 ) Jr 
绍 了 如 何 实现 “个 支持 优先 权 的 合理 调度 策略 . 

































20.10 DCE 支 持 模板 ， 本 质 上 是 线 程 属性 的 结合 表格 。 当 用 DCE 的 pthread_create 创 建 
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20.11 


20.12 


20.13 


20.14 


20.15 


20.16 
20.17 


20.18 


线程 的 时 候 ， 模 板 提 供 渚 如 堆栈 大 小 及 优先 权 这 样 的 属性 ， 和 模板 不 会 在 线程 创建 
的 调用 中 重复 相同 的 参数 ， 同 时 不 运行 在 创建 的 地 点 指定 线 称 属 性 。 用 Table_T 为 
Thread 设 计 一 个 模板 工具 ， 并 修改 Thread_new 计 : 它 接受 模板 作为 其 吓 选 参数 之 一 。 
在 Sequent 这 样 具有 共享 内 存 的 多 处 理 叶 上 实现 Thread 和 Secm ， 这 种 实现 比 20.3 节 
中 详细 叙述 的 实现 要 更 加 复杂 ， 内 为 在 多 处 更 器 上 线程 是 真正 地 基 行 执行 。 实现 
原子 操作 将 需要 基 种 形式 的 低级 口 旋 锁 以 确保 对 访问 共 学 数据 结构 的 小 临界 区 的 
独占 访问 ， 就 像 Threada 和 Sem ph He pi BEF ` 

在 具有 许多 处 理 器 的 大 规模 并 行 处 理 器 (MPP ) 实现 Thread 、Sem 和 Chan ， 例 如 
Cray T3D ， 它 由 2" 个 DEC ALPHA 处 理 器 构成 。 在 MPP 虐 每 个 处 理 器 都 有 它 是 已 
的 内 在， 而 且 一 个 处 理 器 还 要 基 种 低级 机 制 ( 通常 在 硬件 中 实现 ) 以 访问 其 他 处 
理 器 的 内 在 。 这 个 练习 中 的 难点 之 一 是 要 次 定 如 何 把 Thread 、Sem 及 Chan 接 口 喜 
欢 的 共享 内 在 模 型 决 射 到 MPP 提 供 的 分 布 内 他 模型 。 

用 DCE 线 程 实现 Thread 、Sem 和 Chan 。- - 定 要 指明 你 的 Thread_naew 实 现 楼 受 的 
足 那 些 依 束 于 系统 的 可 选 参 数 ， 

HiSolaris 2 上 的 LWP 实 现 Thread , Sem#iChan, Hj; AThread_new HEL oT ve 
BR. 

用 POSIX 线 程 实现 Thread 、Sem 和 Chan ( 参见 Kieiman 、Shah 及 Smaalders 1996 h 
用 Microsoft 的 Win32 线 程 接 U 实现 Thread , Sem 利 Chan ( 参见 Richter 1995 )。 

如 果 你 有 权 使 用 SPARC 的 C 编 译 器 ， 例 如 lcc ( Fraser 和 Hanson 1995 )， 请 修改 这 
个 编译 器 ， 让 它 不 要 使 用 SPARC 寄 存 器 窗 11， 它 在 _swtch PRIER ita 3 系统 调 
用 。 你 还 必须 重新 编译 所 使 用 的 任意 库 ， 估 计 -下 运行 期 中 的 改进 结果 。 敬告 ; 
这 个 练习 是 项 大 丁 哥 。 

Thread_new 必 须 分 配 一 个 堆栈 ,因为 大 多 数 编译 系统 都 俱 定 各 序 开始 运行 时 已 
经 分 配 -个 连续 的 堆栈 。 少数 系统 ， 例 如 Cray-2 ， 足 在 运行 中 按 块 分 配 堆 栈 。 如 
FEHR EGS AA, EAD TEIE aK) BO, FR, EAL aya -个 足 
够 大 小 的 新 块 ， 并 将 这 个 新 块 链 按 到 当前 块 。 当 已 有 序列 的 最 后 一 入 帧 被 得 除 时 ， 
它 就 断 开 块 的 链接 并 释放 其 在 储 空间 ， 这 种 方法 不 仪 简化 了 线程 的 创建 ， 包 自动 
检查 了 堆栈 溢出。 修改 一 个 C 编 洋 器 ， 让 它 使 用 这 种 方法 ， 并 估计 -下 修改 后 的 
好 处 。 和 前 一 练习 一 样 ， 需 要 重新 编译 使 用 的 人 每 个 亩 ;而 用 这 个 练习 也 足 一 项 大 
IH. 





















附录 接口 概要 


下 耐 按 字 母 表 顺序 列 浊 了 接口 概要 ; 小节 中 列举 了 每 个 接口 ， 而 且 如 果 接 口 具 有 基本 类 
型 也 将 其 烈 出。 表示 法 “T 是 隐 式 X_T” 表 未 接 口 X 导 出 了 一 个 隐 型 指针 类 者 X_T 在 描述 中 
STAT. MARE RLS AK SA, ， 就 给 定 了 X_T 的 表示 形式 。 
每 个 接口 的 概要 都 是 以 字母 表 顺 序列 出 导出 的 变 其 以 及 两 数 ， 其 中 不 包括 错 常 。 每 个 耳 
数 的 原型 后 面部 有 它 会 引发 的 异常 及 一 个 简明 的 描述 。 缩 写 cre 和 u.Te 代 表 可 检查 或 不 可 恰 
查 的 运行 期 错误 


下 表 分 类 概括 了 接口 ， 并 给 出 了 上 其 相应 慨 要 开始 的 页 面 。 























EZAR ADT 学 符 串 * 法 S m" 
Arena 471 Array 472 Atom 474 AP 470 Chan 476 
Arith 472 ArrayRep 473 Fmt 477 MP 480 Sem 484 
Assert 474 Bit 474 Str 487 XP 494 Thread 493 
Except. 476 List 478 Text 491 
Mem 479 Ring 483 

Seq 485 

Set 486 

Stack 487 

Table 490 
AP TT 是 隐 式 AP_T 


给 任意 AP 函数 传递 容 T 时 产生 -个 c.r.e.， 

TAP add(T x, Ty) Mem_Failed 

T AP. addi(T x, long int y) Mem, Failed 

返回 x+y 的 和 。 

int AP_cmp(T x, T y) 

int AP. cmpi(T x, long int y) 

如 果 x<y 、X=y 或 x>y 则 分 别 返 回 小 于 0 、 等 于 0 或 大 于 0 的 整数 。 
T AP div(T x,T y) Mem Failed 

T AP. divi(T x. long int y) Mem Failed 

返回 商 x/y; 参见 Arith_div。y=0 是 个 c.r.e.。 

void AP_fmt(int code, va_list *app, int put(int c, void *cl), void *cl, 


unsigned char flags[], int width, int precision) Mem Failed 


AFMR BM: 需要 -个 T， aprini ndi ERRET, app 或 flags 为 空 时 产 
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?Ec.r.e. o 

void AP. free(T +z) 

PERE RZ. z 或 *z 为 空 足 cre.， 

T AP_fromstr(const char *str, int base, char **end) Mem_Failed 

把 str 解 释 为 一 个 以 base 为 底数 的 整数 ， 半 返回 结 呆 工 - 忽略 前 导 空 格 并 接 爱 -个 跟 有 有 
个 或 多 个 以 base 为 底数 的 数字 的 可 选 符 号。 对 于 I0<base 和 36， 小 写字 入 或 大 写字 考 解释 为 
大 于 9 的 数字 。 如 果 cnd null ，*end 就 指向 st 中 终止 丘 描 的 那个 字符 ， 如 果 str 没 有 指定 base 
的 底数 ,AP_fromstr 就 返回 空 ， 而 且 如 果 end 非 闪 就 将 *end 设 为 str。 如 果 str=null 或 者 base<2 
或 base>36 则 产 牛 c.DLe.。 

T AP Ishift(T x, int s) Mem, Failed 

返回 x 左 移 s 位 后 的 结果 : HS EN IE, His ERU TES LOS]. seORI a "Ec.re. 

T AP. mod(T x, T y) Mem, Failed 

long AP modi(T x, long int y) Mem Failed 

返回 x mod y; £ RArith mod. y = OI" *kc.r.e, + 

T AP. mul(T x, T y) Mem, Failed 

T AP muli(T x. long in y) Mem. Failed 

返回 乘积 xy， 

T AP neg(T x) Mem, Failed 

返回 -x。 

T AP_new(long int n) Mem Failed 

分 配 并 返回 初始 为 n 的 一 个 新 T. 

T AP pow(T x, T y, Tp) Mem Failed 

i&IIx*mod p. Rp AA WIR Bix’. y«0zp 3E: (OP <2IN P ^Ec.r.e. - 

T AP rshift(T x, int s) Mem Failed 

返回 x 右 移 s 位 后 的 结果 ; 空 出 的 位 填 零 ， 呈 结果 的 符号 与 x 相同 。s<0 时 产生 ec. 

T AP sub(T x, Ty) Mem, Failed 

T AP. subi(T x, long int y) Mem Failed 

返回 x- yi 。 

Tong int AP_toint(T x) 

返回 符号 与 x 相同 日 值 涛 xl mod LONG_MAX+1 BU) K SCR, 

char * AP_tostr(char *str, int size, int base, T x) Mem_Failed 

Fax base ROME AF RA IE AIA Estr[0..size—1] , 3fig Piste, istry. AP_tostr 分 柄 

str. KES F Ebase> LOM Ha KOM ME. ER Astri DBE #base<2 ulbase>36 

BYP A Pere. 














Arena T 是 隐 式 Arena_T 


给 任意 Arena 晒 数 传递 nbytes 二 0 或 空 T 时 产生 一 个 cre，- 
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void *Arena_ailoc(T arena, long nbytes, const char * file, int line) Arena_Failed 

在 arena 中 分 配 nbytes 个 字 节 ， 并 返回 指向 第 个 字 节 的 指针 : 字 节 内 容 没有 初始 化 。 如 
采 Arena_alloc 引 发 Arena_Failed ， 那 么 file 和 line 就 作为 错误 源 进 行 报告 。 

void *Arena_calloc(T arena, long count, long nbytes, const char *file, int line) 
Arena_Failed 

dearena rh Acount 7c RBH SF Bp lh], & 426 XE dimbytes, FRE A— CRM HET. 
count «Oif H -Aere 元 素 均 木 初始 化 。 如 果 时 产生 ”个 c.re.， 如 果 Arena_calloc 引 发 
Arena, Failed, 3Af ile 和 line 就 作 Wii 行 报告 - 

void Arena, dispose(T *ap) 

释放 *ap 中 的 所 有 空间 ， 释 放 arena 自 身 ， 并 清空 *ap - ap 或 *ap 为 宰 时 产生 一 个 c.r'e,- 

void Arena_free(T arena) 

Fiikarena'} AY AFA As] —— AB -— UA Arena_free li 70 WOT 8 SEIL 

T Arena new(void) Arena_NewFailed 


分 配 、 初 始 化 并 返回 一 个 新 的 arena 。 








Arith 


int Arith_ceiling(int x, int y) 

返回 不 小 于 x/y SOR AUR) BR. y = 0 时 产生 - Pure. 

int Arith_div(int x, int y) 

返回 x/y ， 不 超过 实数 z 的 最 大 整数 .让 z -y=x, 趋向 -xm 进行 截取 ; 例如 ，Arith_div 
(713, 5)jE [p] -3 。y=0 时 产 牛 一 个 ur.e 。 

int Arith_floor(int x, int y) 

返回 不 超过 x/y 实 数 商 值 的 最 大 整数 。y=0 时 产生 一 个 u.r.e。 

int Arith_max(int x, int y) 

返回 max(x, y). 

int Arith_min(int x, int y) 

返回 min(x. y). 

int Arith_mod(int x, int y) 

3E SIX-y + Arith_div(x, y); #40, Arith modC13, 5) 返回 2。y=0 时 产生 - Aure, 


Array T 是 隐 式 Array_T 


数组 下 标 从 0 到 N-1， 这 里 是 数组 的 长 度 。 空 数组 没有 万 素 。 给 任意 Array 两 数 传 递 完 T 


E— Peren 





ay pe 
T Array_copy(T array, int length) Mem, Failed 
创建 并 返回 新 数组 在 放 array 中 的 前 length 个 元 素 。 如 果 length 大 十 array 的 长 度 ， 多 余 的 
元 素 就 被 清空 了 、 
Void Array_free(T *array) 





ej 
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释放 并 清除 *array。array 或 *array 为 空 时 产生 个 c.r.e.、 

void *Array_get(T array, int i) 

返回 指向 array 中 第 i 个 元 素 的 指针 . <0 skim NT E- Pene, iXBNNarray KE 

int Array_length(T array) 

返回 array 中 的 元 素 个 数 。 

T Array_new(int length, int size) Mem_Failed 

分 配 、 初 始 化 及 返回 具有 1lcng 也 个 元 素 的 新 数组 ， 每 个 元 素 为 size 字 节 。 元 素 都 清空 ， 
length<0 或 size >0 时 产生 -个 c.r.e.。 

void * Array, put(T array, int i, void *elem) 

elem ® til Array_size(array) P 4 larray PM 2514638, It Belem. elem 为 空 RH 
i<0 或 1 >N 时 产生 一 个 c.r.e ， 这 里 NN 为 array 长 度 。 

void Array resize(T array, int length) “Mem Failed 

把 array 的 元 素 个 数 改 为 length。 如 果 length 大 于 原始 长 度 ， 多 余 的 元 素 就 被 清空 了- 
length<0 时 产生 — eure... 

int Array_size(T array) 


返回 array 中 元 素 的 字 节 数 。 
ArrayRep T 是 Array_T 


typedef struct T { 
int length; int size; char *array; }*T; 
修改 T 中 的 字段 是 一 个 ur.e 。 
void ArrayRep_init(T array, int length, int size, void *ary) 
用 length , size 和 ary 的 值 初 始 化 array 中 的 字段 。 length 40 Bary 475 , length = 0 dary if 
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空 或 者 size <0 时 产生 一 个 c.re.。 FAM MD HE ETHE PE — ae, 
Assert 


assert(e) 
如 果 e 为 零 则 引发 Assert_Failed。 依 照 名 法 ，assert(e) 足 个 表达 式 。 如 果 包 含 asserLh 时 定 
义 JNDEBUG， 就 禁用 了 断言。 


Atom 


给 任意 Atom IB EXE "str PIE rores. MR CE DER re. 

int Atom length(const char *str) 

JB lel RP str fg KBE, ste RE — A RTH PIE — rores, 

const char * Atom, new(const char *str, int len) Mem Failed 

为 str[0--lcp-1] 返回 个 原子 ， 如 果 需 要 新 建 一 个 .len<0 时 产生 Pere., 


const char * Atom, string(const char *str) Mem_Failed 
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J& IP Atom, new(str, strlen(str)) . 
const char * Atom int(long n) Mem Failed 


为 0 的 十 进 制 字符 中 表示 形式 返回 一 个 原子 。 
Bit T 是 隐 式 Bit_T 


HRT Bof A PROSIN-1, ENE ME. HE Bit Bee STH IE 
个 cTe， 除 了 Bit_union Bit inter, Bit minus MBit_diff ~ 

void Bit_clear(T set, int Jo, int hi) 

清除 set 中 的 位 lo.bi。lo>hi 、lo<0 或 lo > 六 时 产生 一 个 cfe.， 这 里 六 为 set 的 长 度 ，i 也 类 似 。 

int Bit_count(T set) 

返回 set 中 1 的 个 数 。 474 

T Bit_diff(T s, Tt) Mem Failed 

返回 sf 的 对 称 差 分 : s 和 t 的 异 或 。 如 果 s 为 空 或 t 为 定 ， 它 就 表示 空 集 。8 为 空 RUN GN. 
s 和 t 长 度 不 同时 产生 一 个 c.r.e.。 

int Bit_eq(T s, T t) 

如 果 s=t 则 返回 1 省 则 返回 90。s 和 t 长 度 不 同时 产生 一 .个 c-T.e.。 

void Bit free(T *set) 

RUFI set, setak *set 923 IPSE —Pe.r.e., 

int Bit. get(T set , int n) 

返回 第 位。n<0 或 n SNIE "E— Fere, REN Aet KE 

T Bit_inter(T s, Tt) Mem Failed 

返回 smt: siti E lj. Hore Bit diff. 

int Bit_length(T set) 

返回 set 的 长 度 ， 

int Bit leq(T s, T t) 

如 果 s St 则 返回 1; 理 则 返回 0 Mere SABit_eq, 

int Bit_lt(T s, T t) 

如 果 s CMR BL; SRNA HO, Here Bit eq. 

void Bit_map(T set, void apply(int n, int bit. void *cl), void *cl) 

set 中 从 第 0 位 到 第 N-1 位 的 每 一 位 都 沿用 apply(n, bit, cD ， 这 里 六 为 set 的 长 度 。 通过 apply 
修改 set 以 作用 士 bit 后 来 的 值 。 

T Bit minus(T s, Tt) Mem Failed 

返回 s-t: s 和 ~t 的 逻辑 与 。 其 cre 参 见 Bit_diff。 

T Bit_new(int length) Mem Failed 

创建 并 返回 ength 长 度 的 新 位 矢量 0。length<0 时 产生 一 个 cre 

void Bit_not(T set, int lo, int hi) 

将 set 中 的 位 lo..hi 取 反 。 AKc.r.e Z& WBit clear, 
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int Bit_put(T set, int n, int bit) 

An HA Abie, JR Pirn S348. bit«Oxkbit 1 Af sXn«O gn =NH E- Pere. 
这 时 入 为 set 的 长 度 。 

void Bit_set(T set, int lo, int hi) 

设 半 set 中 的 位 lo.hi。 其 c.re 人 参见 Bit_ciear . 

T Bit_union(T s, Tt) Mem Failed 

返回 s Ut: SHE Hag. Hore f RLBit diff, 


Chan TER Chan T 


HME Chan BEB "ST IY Thread. ivit 2 ñj AS 

T Chan new(void) Mem Failed 

CIE. us kk s BER W. 

int Chan, receive(T c, void *ptr, int size) 

等 待 相应 的 Chan send、 然 后 从 发 送 方 描 六 size 之 多 的 宁 革 到 ptr， 并 返回 找 由 的 字 节 数 ， 
ptr? eisize«O lI 77 4E — Sere. 

int Chan. send(T c, const void *ptr, int size) Thread. Alerted 

等 待 相应 的 Chan_receive ,然后 从 ptr 拷 凡 size 之 多 的 字 季 到 接收 方 ， 并 返回 拷 由 的 字 节 
3%. Hic.r.e W.Chan receive. 
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Except TExcept_T 


typedef struct T (char *reason; ) T; 

TRY 请 名 的 语法 如 下 所 示 ;8 和 e 开具 语句 和 异常 。ELSBE 诸 名 可 选 ， 

TRY S EXCEPT(e,) S;...EXCEPT(e,) S, ELSE So END TRY 

TRY S FINALLY S, END TRY 

void Except raise(const T *e, const char *file, int line) 

在 源 坐 标 file Mine SLE FEM ^e. CWS BEP IE rores ,未 捕捉 的 异常 将 使 程序 中 上 断 。 
RAISE(e) 

"Re. 

RERAISE 

再 次 引发 使 管理 器 运行 的 异常 。 

RETURN 

RETURN 表达 式 

是 个 用 在 TRY 语句 中 的 返 同 诸 铝 。 在 TRY 语句 中 使 用 C 返 回 语句 会 产生 -个 are c 





Fmt T 是 Fmt_T 


typedef void (*T)(int code, va_list *app, int put(int c, void *cl), void *cl, 
unsigned char fiags[256], int width, int precision) 
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EX Y ete ME, H 623835 RE A GM s PE Fmt SE. 这里， 调用 
putte, cD/E HR AE ste FHC. 414-1(162 0 BEA 了 转换 指示 符 的 初始 集 ， 向 什 意 Fmt 函 数 
传递 宰 put 、but 或 fmt .或 者 格 虑 出 使 用 了 与 转换 丽 数 无 关 的 转换 指示 符 ， 

char *Fmt flags = "—407 
指向 可 以 出 现在 转换 符 中 的 标 

void Fmt_fmt{int put(int c, void *cl), void *cl, const char *fmt, ...) 
根据 格式 中 tmt 格 式 化 并 生成 “…” 参 数 。 

void Fmt_fprint(FILE *stream, const char *fmt, ...) 





void Fmt_print(const char * fmt, ...) 

根据 fmt 格 式 化 并 生成 “…” 参 数 : Fmt fprintEr slstream , Ti Fmt, print E] stdout, 

void Fmt_putd(const char *str, int len, int put(int c, void *cl), void *cl, 

unsigned char flags[256], int width, int precision) 

void Fmt_puts(const char *str, int len, int put(int c, void *cl), void *cl, 

unsigned char flags[256], int width, int precision) 

HFA BRAME ( 参见 162 页 的 表 14-1 ) 和 flags width 和 precision 的 值 格式 化 并 在 
str[0.Jen--1] 牛 成 转换 过 来 的 数字 (Fmt_putd ) 和 字符 中 ( Fmt_puts ) str-y“¥, len<Oak 
flags 为 空 时 产生 一 个 cre.。 

T Fmt register(int code, T evt) 

把 cvt 与 格式 符 code KK , 3EJR WIHT — $64 BI, code«0 ricode»255 M P^ /E— Mere.. 

int Fmt_sfmt(char *buf, int size, const char *fmt, . .) Fmt Overflow 

根据 fmt 格 式 化 “...” 参 数 并 放 入 buf[1..size-1] ， 在 末尾 附加 - -个 空 字符 ;以 及 返回 buf 
的 长 度 。size <<0 时 产 牛 一 个 c.r.e， 如 果 生 成 了 多 余 size-~1 个 字符 则 引发 Fmt_Overflow 。 

char *Fmt_string(const char *fmt, ...) 

很 据 fmr 将 “…” 参 数 恪 式 化 成 以 nu 结束 的 字符 中 ， 并 返回 这 个 字符 囊 。 

void Fmt_vfmt(int put(int c, void *cl), void *cl, const char *fmt, va list ap) 

参见 Fmt_fmt ;从 ap 列表 中 接收 参数 、 

int Fmt_vsfmt(char *buf, int size, const char *fmt, va_list ap) Fmt_Overflow 

参见 Fmt_sfmt ， 从 ap 列表 中 接收 参数 , 

char *Fmt vstring(const char *fmt, va_list ap) 


参见 Fmt_string ; SH Rapr KSB, 
List TEList_T 


typedef struct T *T; 

struct T ( T rest; void *first; }; 

STA List 88 WHE Blist SHES BT IEE BE SOE 

T List_append(T list, T tail) 

给 list 琳 尾 添加 tail 并 返 Fis, Mist 为 空 , List append S [tail , 
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T List copy(T list) Mem Failed 

创建 并 返回 最 高 级 别 的 副本 。 

void List free(T *list) 

释放 并 清空 *list 。list 为 空 时 产生 一 个 c.re.。 

int List_length(T list) 

返回 list 中 的 元 素 个 数 。 

T List list(void *x, ...)) Mem Failed 

创建 并 返回 一 个 列表 ， 其 元 素 为 “…” 参 数 ， 一 直到 第 :个 空 指 针 。 

void List_map(T list, void apply(void * *x, void *cl), void *cl) 

对 list 中 的 每 个 元 素 p 调 用 apply(&p ->first, cij。 如 果 app]y 修 改 list 则 为 一 个 ure、 

T List_pop(T list, void * *x) 

如 果 x 非 空 ， 把 list->first 赋 给 *x ;释放 iist 并 返回 list->rest 。 如 果 list 为 空 ，List_pop 返 回 
SERIE TEX. 

T List, push(T list, void *x) Mem, Failed 

Flist BUR LS T — T ion RAF ex, HT HR 、 

T List, reverse(T list) 

Hist PH TEA MOBIL PEE I, PAIR GR SL AOU AEA 10 2. 

void * * List toArray(T list, void *end) Mem Failed 

QIiE— TNF TOR HOR, Ehei liste NA OR. HPI HEU Rf 6 — 4 
元 素 的 一 个 指针 。 数 组 中 的 第 N 个 元 素 是 cnd。 





Mem 


向 任意 Mem 函数 或 宏 传递 nbytes <0, 

ALLOC(nbytes) Mem, Failed 

SrBinbytes s ++ JE38 BIS IS A8 — Ag T SHE FREE, SL Mem, alloc , 

CALLOC(count, nbytes) Mem, Failed 

A Seount WR 89388 28 2p Bez E], Ae PCE nbytes K, JE [eld AR — n 7638 HR 
ft. count SORNE Æ- Fore. FC TER um. SJ Mem callos, 

FREE(ptr) 

如 果 ptrs# 空 就 释放 ptr ， 并 有 日 清除 ptr。 多 次 计算 ptr。 人 参见 Mem_free 。 

void *Mem_alloc(long nbytes), const char *file, int line) Mem Failed 

分 配 hbytes 字 节 并 返回 带 向 第 一 个 字 节 的 指针 。 宁 节 未 初始 化 。 如 朵 Mem_alloc 引 发 
Mem Failed ,file 和 line 就 作为 错误 源 进行 报告 。 

void *Mem_calloc(long count, long nbytes, const char *file, int line) Mem Failed 

为 一 个 count 元 素 的 数组 分 配 空间 ， 每 个 元 素 册 nbytes 字 攻 ， 并 返回 指 癌 第 一 个 元 素 的 指 
SF. count <0 时 产生 一 个 c.r.e.。 共 中 元 素 都 被 清 容 ， 人 不 需要 将 指向 补 误 学 点 数值 的 指针 初始 
化 为 0.0、 如 果 Mem_calloc 引 发 Mem_Failed， 有 ile 和 line 就 作为 错误 源 进行 报告 。 


on 347 





void Mem_free(void *ptr, const char *file, int line) 

如 果 ptr 非 空 则 释放 ptr。 如 果 ptr 是 Mem ro Bs AA T — AA Brz ol E, We — 
个 u.r.e。 实 现 使 用 file 和 line 报 告 内 存 使 用 错误 。 

void *Mem_resize(void *ptr, long nbytes, const char *file, int line) Mem, Failed 

wk ffitenbytes FY Mptr tebe Bul KU, 3E:E Ia repa PIR NE red $F. dq 
Dbytes 超 出 原始 块 的 大小， 多余 的 宇 节 就 不 初始 化 ， 如 果 nbytes 小 于 原始 块 的 大小， 那么 仪 
有 nbytes 字 节 出 现在 新 块 中 、 如 朵 Mem_resize 引 发 Mem_Failed ，file 和 line 就 作为 错误 源 进 
行 报告 。ptr 为 空 时 产生 - -个 cT.e; 如 果 ptr 是 Mem 分 配 函 数 的 前 一 调用 所 未 返回 的 指针 ， 则 
引发 一 个 ure。 

NEW(p) Mem, Failed 

NEWO(p) Mem Failed 

A3 CE AE K Ja AES MC p. Pp EROR de QE, JOE GI ht. NEWO Rx Aeg AT 
内 容 ，NEW 则 不 进行 初始 化 。 这 两 个 宏 部 仅 计 算 次 ptr 

RESIZE(ptr, nbytes) Mem Failed 

修改 存放 nbytes 字 节 的 ptr 存 储 块 的 大 小 ， 并 让 ptr 重 新 指向 大 小 调整 后 的 存储 块 ， 然 后 返 
问 抉 地 址 。ptr 要 多 次 计算 。 参 见 Mem_resize , 


MP T 是 MP_T 


typedef unsigned char *T 

MP oh Sen fie AF SMA SHG ， 这 里 n 最 初 为 ?2 ， 而 且 可 以 通过 MP_set 修 改 ， 两 
数 指定 以 u 或 ui 结尾 的 执行 无 符号 算法 ; 其 他 的 执行 有 符 呈 算法 。 MP 函数 在 引发 
MP-DivideByZero MP Overflow 前 计算 它们 的 结果 。 癌 任 间 MP 两 数 传递 写 T 会 产生 - -个 
Cre... 向 任意 MP 函数 传递 太 小 的 T 会 产生 一 个 ure。 

T MP add(T z, Tx, Ty) MP_Overflow 

T MP. addi(T z, T x, long y) MP Overtlow 

T MP. addu(T z, Tx, T y) MP. Overflow 

T MP addui(T z, T x, unsigned long y) MP. Overflow 

z 没 为 x+y， 并 返回 z。 

T MP_and(T z, T x, T y) 

T MP_andi(T z, T x, unsigned Jong y) 

zx AND y， 并 返回 z。 

T MP ashift(T z, T x, int s) 

z 设 为 x 右 移 s 位 后 的 值 并 返回 z。 空 出 的 位 填 上 x 的 符号 位 ，s<0 时 产生 一 Pere. a 

int MP emp(T x, T y) 

int MP cmpi(T x, long y) 

int MP cmpu(T x, T » 

int MP cmpui(T x, unsigned long y) 
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X<y 、X=y 或 x*>y 时 分 别 返回 小 十 0 、 等 于 0 或 大 十 0 的 整数 . 

T MP. cvt(int m, T z, T x) MP Overflow 

T MP. cvtu(int m, Tz, Tx) MP Overflow 

{Ux Hah eU" A — m ERU 88 RIGHE BE KAZ, | 
Pere. o 

T MP. div(T z, T x, Ty) MP Overflow, MP_DivideByZero 

T MP. divi(T z, T x, long y) MP Overflow, MP. DivideByZero 

T MP divu(Tz, Tx, Ty) MP DivideByZero 

T MP divui(T z, T x, unsigned long y) MP Overflow, MP DivideByZero 

ZPA xiy HR iz, AH SR ROS T o RK; 参见 Arith_div- 

void MP. fmt(int code, va_list * app,int put(int c, void *cl), void *cl, 





后 返回 z- m<2 时 产生 一 


unsigned char flags[], int width, int precision) 

void MP. fmtu(int code, va list * app,int put(int c, void *cl), void *cl, 

unsigned char flags(], int width, int precision) 

JéFmtt Mee Y, TIE EL TTR PRD, FE fprintff %4 和 %uj REE Cr KE 
[si] b<2 或 pb>36 时 和 app 或 ilags 为 空 时 产生 Peres 

T MP_fromint(T z, long v) MP Overflow 









T MP_fromintu(T z, unsigned long u) MP. Overflow 

z 设 为 v 或 u 并 返 梧 z- 

T MP. fromstr(T z, const char *str, int base,char * *end) MP. Overflow 

str f S Abase AJ I — dX, HR MK 3. REA, £m 
AP_fromstr , 

T MP_Ishift(T z, T x, int s) 

z 设 为 x 左 移 s 位 后 的 值 然后 返 同 z:。 空 出 的 位 填 F 替 。s<0 时 产生 Aore. 

T MP. mod(T z, T x, T y) MP_Overflow, MP. DivideByZero 

zz x mod y3ri& Plz, ffe] -oitir $ BLArith mod. 

long MP modi(T x, long y) MP Overflow, MP DivideByZero 

返回 x mod y, 趋向 于 -% 进 行 截取 ; £ WArith_mod. 

T MP.modu(Tz Tx, Ty} MP_DivideByZero 

ZEH x mod y 并 返回 z。 

unsigned long MP_modui(T x, unsigned long y) MP_Overflow, MP_DivideByZero 

返回 x mod y, 

T MP_mul(T z, T x, Ty} MP Overflow 

z 设 为 xy 并 返回 z， 

T MP_mul2(T z, T x, T y) MP Overflow 

T MP_mul2u(T z, T x, T y) MP. Overflow 

z 设 为 xy 的 双 倍 长 度 结果 并 返回 具有 2n 位 的 z， 
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T MP_muli(T z, T x, long y) MP_Overflow 
T MP. mulu(T z, T x, T y) MP Overflow 
T MP. mului(T z, T x, unsigned long y) MP. Overflow 
Zz 设 为 X + y 并 返回 z | 
T MP. neg(T z, Tx) MP Overflow 
zi x Wiz. 
T MP new(unsigned long u) Mem, Failed, MP. Overflow 
创建 并 返回 初始 bua - T 
T MP no«T z, T x) 
zit N ~x Jg Flza 
T MP_or(T z, T x, T y) 
T MP_ori(T z, T x, unsigned long y) 
z 设 为 x OR y 并 返回 z ， 
T MP rshift(T z, T x, int s) 
z 设 为 x 右 移 s 位 后 的 值 并 返回 z， 空 出 的 位 填 零 。s<0 时 产生 -Pere 
int MP_set(int n) Mem_Failed 
重新 将 MP 设置 为 8 位 算法 。n<2 时 产生 -个 c.r.e. 5 
TMP_sub(T z, Tx, T y) MP Overflow 
T MP. subi(T z, T x, long y) MP. Overflow 
T MP.subu(T z, T x, T y) MP Overflow 
T MP. subui(T z, T x, unsigned long y) MP Overflow 
z 设 为 x-y 站 返回 z。 
long int MP_toint(T x) MP. Overflow 
unsigned long MP_tointu(T x) MP_Overflow 
x 返 回 位 一 个 长 整数 或 无 符号 I. 
char * MP tostr(char *str, int size, int base, T x) Mem Failed 
Str[0..size -1] #4 null 24 Jé fx il base fig MEH KER, 然后 返回 sr 。 如 果 str 为 空 ， 
MP_tostr 则 忽略 size 并 分 配 这 个 字符 中 。 参见 AP_tostr 5 
T MP_xor (T z, Tx, T y) 
T MP. xori(T z, T x, unsigned long y) 
z Ax XOR y Hk lz 。 





Ring TÆR stayRing_T 


FRAY FOR AAO SUN-1, BN SS AEE. SIR EEA LK, 任何 地 方 部 可 以 添加 或 删除 指 
Sty 环 字段 扩充 。 旋 转 一 个 环 改变 它 节 原 点 。 向 任意 Ring 聊 数 传递 -个 六 T 会 产生 一 个 cre.。 

void *Ring_add(T ring, int pos, void *x) Mem Failed 

fring 'T pos fir TE ArH A Bx, (EIS 的 是 元 素 之 加 的 点 ; SX Str, pos < -NN 或 
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Pos>N+1 时 产生 一 个 c.r.c， 这 里 入 为 ring 的 长 度 。 

void *Ring addhi(T ring, void *x) Mem, Failed 

void *Ring addlo(T ring, void *x) Mem, Failed 

向 ring 的 高 端 (下 标 w-1 ) 或 低 端 (下 标 0 ) 添加 x ， 并 返 eixe 

void Ring free(T *ring) 

释放 并 尘 除 *ring 。ring 或 xring 为 空 时 产生 eres 

int Ring length(T ring) 

返 同 ring 中 的 元 素 个 数 。 

void * Ring_get(T ring, int i) 

a AT AGA PIR. ORISNI AE -个 c.r.e ， 这 里 N 足 ring 的 长 度 ， 

T Ring new(void) Mem_Failed 

创建 并 返回 一 个 空 环 。 

void *Ring put(T ring, int i, void *x) Mem Failed 

JEringr f Si ToC E B 为 并 返回 以 前 的 值 ， 其 cr.e 参 见 Ring_get 。 

void *Ring_remhi(T ring) 

void *Ring_remlo(T ring) 

删除 并 返回 ring 高 端 (下 标 N-1 ) 或 低 端 (下 标 0 ) 的 元 素 ，ring 为 空 时 产生 一 个 cf.e.。 

void* Ring_remove(T ring, int i) 

从 ring 删 除 并 返回 元 素 i。i<0 或 i>N 时 产生 -… 个 c,r.e 、 这 里 NW 是 ring 的 长 度 。 

T Ring ring(void *x,...) Mem Failed 

创建 并 返回 一 个 环 ， 其 元 素 为 “.…” 参 数 外 到 第 一 个 空 指针 。 

void Ring_rotate(T ring, int n) 

把 ring 的 原点 向 左 (n<0 ) 或 向 右 (n0) 旋转 mn 个 元 素 。Inl<0 或 Ini>N 时 产生 一 个 c.r.e， 
这 里 N 是 ring 的 长 度 。 


Sem TT 是 隐 式 的 Sem_T 


typedef struct T { int count; void *queue; } T; 

直接 读 写 T 中 的 字段 ， 或 向 任意 Sem 函 数 传递 未 初始 化 的 T 足 个 nr.e 、 癌 任意 Sem 函 数 伟 
BRT RE Ha Thread_init2 ñj WHI (EB Sem BAAS I] R- Aere., 

LOCK 语 句 的 句法 如 下 ; S 和 mm 表示 诺 句 太 T， 

LOCK(m) S END_LOCK 

in 被 锁定 .执行 语句 S 并 解 开 m。LOCKe 可 以 引发 Thread_Alerted 。 

void Sem_init(T *s, int count) 

把 s->count 设 为 count。 在 同一 TF 上 多 次 测 用 Sem_init Aure, 

Sem_T *Sem_new(int count) Mem_Failed 

创建 并 返回 -个 count 字 段 初始 化 为 count 的 T , 

void Sem_wait(T *s) Thread_Alerted 
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等 待 直到 s ->count>0， 然 后 递减 s->count， 
void Sem_signal(T *s) Thread_Alerted 
递增 s->count 。 


Seq T 是 隐 式 的 Seq_T 





序列 下 标 从 0 到 -1 ， 这 里 W 基 序列 的 长 度 . 空 序列 内 有 元 素 。 低 端 (下 标 0 ) 或 高 端 
(N-1) PA RI RRS: FA ADE. ME A Seg RE RTAS r.e. 

void *Seq_addhi(T seq, void *x) Mem_Failed 

void * Seq_addlo(T seq, void *x) Mem_Failed 

向 seq 的 高 端 或 低 端 添加 x 并 返回 x。 

void Seq_free(T *seq) 

释放 并 清空 wseq。seq 或 *seq 为 实时 产生 -个 cre.。 

int Seq_length(T seq) 

返回 segq 中 的 元 素 个 数 。 

void * Seq_get(T seq, int i) 

返回 seq 中 的 第 i 个 元 素 。i<0 或 i=N 时 产生 -个 c.re、 这 里 六 为 seqd 的 长 度 

T Seq_new(int hint) Mem_Failed 

false 3EJR IF FE. hint c RUA Ab OAT. hint<0 时 产生 - .个 c.re.。 

void * Seq_put(T seq, int i. void *x) 

Hse fi NERE Pk ax EXE ID ATA, Ac.r.e & IL Seq get. 

void * Seq remhi(T seq) 

void * Seq remlo(T seq) 

删除 并 返回 seq 的 高 端 或 低 端 苑 素 seq 为 定时 产生 eere 485 

T Seq_seq(void *x,...) Mem Failed 

创建 并 返回 -个 序列 ， 其 元 素 为 “…” 人 参数 直到 第 -个 空 指针 。 


Set T 是 隆 式 的 Set T 


WR YSet_diff, Set inter, Sct minus 和 Set_union 函数 把 空 T 解 释 成 衬 集 ， 向 任意 Set 函 数 
传递 空 nember 或 T 都 旦 个 c.re.。 

T Set diff(T s, Tt) Mem Failed 

返回 s/t 的 对 称 差分 子 集 : 元 素 仪 出 现在 s 或 (4, 的 集合 s WA ASRA EAER 的 cmp 和 
hash 函 数 的 非 空 5 和 t， 会 产生 一 个 c.r.e.。 

void Set_free(T *set) 

FOR FPA Us set, seta *set ary 时 产生 一 个 c.r.e.。 

T Set_inter(T s, Tt) Mem, Failed 

返回 s nt; 元 素 出 现在 s 和 + 中 的 几 个 集合 。 其 c.re. Set diff. 

int Set_length(T set) 
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void Sct, map(T set, void apply(const void * member, void *cl), void *cl) 

Jj & member € seti Happly(member, cD 。apply 要 修改 set 则 产生 :个 cre. . 

int Set_member(T set. const void *member) 

Az member € set 则 返回 1 : d Mie Fo 

T Set_minus(T s, Tt) Mem Failed 

BES-A: TR EA Fes (A AN ULL OU Sr. Here. By Set diff, 

T Set. new(int hint, int cmp(const void *x, const void *y), 

unsigned hash(const void *x)) Mem, Failed 

创建 、 初 始 化 关 返 回 一 个 空 集 全 ， 甘 jhint 、cmp 和 hash 人 参见 Table_new 的 说 明 ， 

void Set_put(T set, const void *member) Mem, Failed 

如 果 > isetififlimember , 

void * Set remove(T set, const void * member) 

如 果 member € set, Jul seti ['Bilffsmember, 32M 646; 否则 ; Set removei ls. 
void ** Set toArray(T set, void *end) Mem, Failed 

EIE -TN+1 clement ot SE BOR, MRH ERAT (e etr iW DER, JRE 





TIGR AIRE. SEN 638 Hend, 


T Set_union(T s, Tt) Mem Failed 
Es Ut: 元素 出 现 s 或 (的 集 从; Hoere. Bl Set_diff. 


Stack T 是 隐 式 Stack_T 


Str 


向 任意 Stack ES Pei ETE -Pere 

int Stack_empty(T stk) 

如 果 stk 为 空 则 返 加 1; AF GE FIO. 

void Stack_free(T *stk) 

释放 并 清空 *stk ，s 丝 或 *stk 为 实时 产后- -个 c-re. 
T Stack_new(void) Mem_Failed 

返回 一 个 新 的 空 T 

void * Stack_pop(T stk) 


弹出 并 返回 sk 的 项 端 元 素 、stk 为 空 时 产生 ores. 
void Stack_push(T stk, void *x) Mem_Failed 
将 x 推 和 人 堆栈 顶端 


SG 函数 处 理 以 nul 结 尾 钓 字符 串 、 位 兽 销 定 两 个 字符 之 疗 的 点 ; 例如 ，STRING 中 的 位 


r 
E 


HSSTIRAUN SG; 
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BIVATE- RB iN EERE. Quito te ISI PRISON H 25 ty BOE B), # F mito 
feb. st) ss di A Bl SA F AE PAE Str RACE URS Fe FEB (u W RER 
指针 会 产生 - Dere.. 除了 Str_eatvy 和 Str map 指明 的 具体 情况 - 

int Str_any(const char *s, int i,const char * set) 

如 果 s[i: HI] Hi Bliteset rn, Wik Ms HE ME ARMS EAA, APUIRIEIO. set AN apt 
Heres 

char * Str. cat(const char *s1, int il, int j1, const char *s2, int i2, int j2) Mem Failed 

返回 s1lil:j1] 连 接 E5202: j2) MR. 

char * Str_catv(const char *s, ...) Mem Failed 

返回 一 个 由 “…” 中 的 三 元 组 所 构成 的 字符 串 ，. -将 到 一 个 空 指 针 、 答 个 三 元 组 指定 .一 
个 s[i: jl; 

int Str_chr(const char *s, int i, int j, int c) 

返回 sf j] rc Ze n vu aS fes rh FERES 

int Str cmp(const char *sl, int iJ, int j1, const char *s2, int i2, int j2) 

如 果 s101: j1]«s2(i2: j2], sll: jll=s2fi2: j2] nest fil: j1]»s2132: j2] 则 分 别 返 i 小 于 0 、 
等 于 0 或 大 于 0 的 一 个 整数 。 

char * Str_dup(const char *s, int i, int j.intn) Mem, Failed 

返回 sf j] Kin P BEAR. n<OR E 一个 c.T-e.。 

int Str, find(const char *s, int i, int j, const char *str) 

JE ls[i: j] rhstr B) 3k f do 839 fs 8 22 Wi fes pn fot o 

void Str, fmt(int code, va_list *app, int put(int c, void *cl), void *cl, 

unsigned char flags[], int width, int precision) 

E TFmtte RK. ES BR kiki p Bi EE OE Liprintt AY % s Bl 
将 格式 化 这 个 子 字符 忠 。app 或 flags 为 空 时 产生 —^ec.re.- 

int Str_len(const char *s, int i, int j) 

返回 sfi; 3] K BE, 

int Str many(const char *s, int i, int j, const char *set) 

返回 8 让 THU Sk ñi iB A ser TE 6g —h den THTZUS ed BQ 812 RG BGEO, set 为 
宰 时 产生 一 个 cre. a 

char *Str, map(const char *s, int i, int j, const char *from, const char *to) Mem_Failed 

返回 一 个 根据 from 种 toes shi: 让 中 的 字符 所 得 到 字符 息 ,sfi: 庆 中 出 现在 from 的 每 个 宁 
符 都 被 映射 到 to 中 的 相应 字符 。 没 有 处 在 from 的 字符 映射 成 自身 ”如果 from Fito aes, gt 
使 用 它们 以 前 的 值 。 如果 s 为 室 ，from 和 to 建立 - 个 默认 的 映射 . from 利 to 中 仅 有 一 个 为 空 时 。 
strlen(from) zstrlen(to) 时 ，s 、from 及 to 部 为 空 时 .或 者 第 . -次 调用 from 和 to 都 为 空 时 产生 
一 -个 c.r.e.。 

int Str match(const char *s, int i, int j, const char *str) 


Aust: j] str Jt UR Vis rh ar f8 fg 38, SRM ETO. ste ys Ege — PCL. 
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int Str_pos(const char *s, int i) 

返回 s[i: jJ IZ FE (EU E 减 1 生 成 sfi: ie 1] BF t. 

int Str. rchr(const char *s, int i, int j, int c) 

JEStr chr UR A ER, 

char * Str, reverse(const char *s, int i, intj) Mem Failed 

Bsli: 3] TS 4809 JH EL PF AE 1. Hol] As3E E TEE IH RIETI S 

int Str rfind(const char *s, int i, int j, const char *str) 

是 Str_find 的 最 右边 变 体 、 

int Str_rmany(const char *s, int i, int j, const char * set) 

返回 s[i; 末尾 从 set 开 始 的 “中 非 空 字符 之 后 在 s 中 的 正和 什 位置; 入 则 返回 0 。set 为 空 时 
PUE bere. 

int Str. rmatch(const char *s, int i, int j, const char *str) 

dms: jI Astr A RE Els rf ste 2 J BUE (PUT 5 否则 返 加 9、str 为 空 时 产生 一 个 cre.。 

int Str rupto(const char *s, int i, int j, const char *set) 

是 Str_upte 的 最 右边 灾 体 。 

char * Str_sub(const char *s, inti, int j) Mem Failed 

返回 s[i: jl, 

int Str upto(const char *s, int i, int j, const char *str) 

返回 set 中 任 Y desli: 让 的 最 左边 出 现 位 贮 之 前 在 s 中 位置 否则 返回 9。set 为 空 时 产 
A Dore o 





Table TRS Table_T 


HHE Table oh (Ei ATRAE key AE 一 个 ce 

void Table_free(T *table) 

释放 并 清空 *table。 table 或 *table 为 裤 时 产 牛 一 个 c-Te.。 

void * Table get(T table, const void *key) 

返 同 table 中 与 key 相 关联 的 值 ; 如 果 table 中 没有 key 则 返回 空 。 

int Table_length(T tablc) 

返回 table 中 键 - 值 对 的 个 数 。 

void Table_map(T table,void apply(const void +key, void **value, void *cl), void *cl) 

对 table 中 每 个 键 ~- 值 对 按 林 指定 的 顺序 调用 apply(key, &value, cl). apply 要 修改 table 会 
产生 一 个 c.re,， 

T Table_new(int hint, int cmp(const void *X, const void *y), 

unsigned hash(const void *key)) Mem_Failed 

AVE. BU SEAL SIE i] — rep MERE BOR EL a SR hint 足 对 这 种 键 - 值 对 
期 望 个 数 的 估计 -hint<0 时 产生 -个 c.r.e.。 cmp 和 hash 尽 比较 和 散 匈 这些 键 的 函数 。 对 于 键 x 
Ay, Mü 3x<y. x=yBix>y, cmp(x, 7) 则 必须 分 别 返回 小 于 0 ， 等 T0 或 大 DORES mns 
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cmp(x, y) 返 回 0， 那 么 hash(x, y) 必 须 等 十 hash(y)， 如 果 cmp US Khash HR , 那么 
Table_new 就 使 用 适合 于 Atom_T 键 的 一 个 函数， 

void * Table_put(T table,const void *key, void *value) Mem_Failed 

把 table 中 key 的 关联 值 改变 为 value 并 返回 以 前 的 值 ; 或 者 ， 如 果 table 中 没有 key 就 添加 
key flvalue, 3438 I% , 

void * Table_remove(T table, const void *key) 

从 table 中 删除 key- 值 对 并 返回 删除 的 并 个 值 。 如 果 table 中 没有 key , Table removes + 
产生 作用 并 返回 空 ， 

void ** Table_toArray(T table, void *end) Mem_Failed 

创建 一 个 2N+1 -element 个 元 素 的 数组 ， 以 术 指 定 顺 序 存 放 table 中 N 个 键 - 值 对 ， 并 返回 
第 -一 个 元 素 的 指引。 出 现在 伪 数 位 置 数组 元 素 中 的 刍 太 此 相应 的 值 出 现在 其 后 的 奇数 位 兽 元 
BP; TURIN end, 


Text T&Text_T 


typedef struct T ( int len; const char *str; } T; 

typedef struct Text, save T * Text save T; 

T 是 个 描述 符 客户 可 以 读 取 描述 答 的 字段 ， 但 是 写 这些 字 段 则 是 -Mure Text Ri i8 
value EXE BG ; [S EXETexti 3846 Mist? dtlen«0 MBER, ena Tere 

Text 为 其 恒 不 变 的 字符 串 管理 内 存 ; 在 这 部 分 字符 中 空间 进行 号 操 人 或 用 外 部 手段 释放 
这 部 分 空间 都 是 个 u.r'e.。 字 符 毕 空 闻 中 的 字符 串 可 以 包含 空 字符 ， 央 此 不 能 VLE AEH R 

HET ext iC HOS ALA ie FFF SL IU A REE ; 参见 Str。 下 面 的 描述 符 中 (88 :中 表 
示 s 中 位 置 i 和 j 之 癌 的 子 申 。 

const T Text_cset = { 256, “\O00\001..\376\377”" } 

const T Text_ascii = { 128, “\000\001...\176\177” } 

const T Text_ucase ={ 26, "ABCDEFGHIJKKLMNOPQRSTUV WXYZ " J 

const T Text lcase ={ 26, "abcdefhijkImnopqrtuvwxyz" y 

const T Text digits = { 10. “0123456789” } 

const T Text null. ={ 0, “” } 

是 经 过 如 上 初始 化 的 静态 描述 符 。 

int Text_any(T s, int i, T set) 

如 果 s[i : it 了 出 现在 set 中 则 返回 其 后 在 s 中 的 位 置 ; 否则 返回 0 。 

T Text_box(const char *str, int len) 

为 客户 分 配 的 长 度 为 len 的 字符 申 st 建立 并 返回 一 个 描述 符 。 St 为 空 和 en<0 时 产生 一 个 cre,。 

T Text cat(T s1, T s2) Mem Failed 

返回 s1 连 接 s2 后 的 值 。 

int Text. chr(T s, int i, int j, int c) 

参见 Str_chr。 
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int Text cmp(T sl, T s2) 

如 果 sl<s2 、s1=s2 或 5s1>s2 则 分 别 返回 小 于 0、 等 于 0 或 大 二 0 的 一 个 整数 。 

T Text_dup(T s, intn) Mem_Failed 

返回 gs 的 n 个 副本 。n<0 时 产生 一 个 c.re,。 

int Text_find(T s, int i, int j, T str) 

参见 Str_find 。 

void Text_fmt(int code, va_list *app, int put(int c, void *cl), void *cl, 

unsigned char flags[], int width, int precision) 

AT FUE UBL ELEC AME aR 918 EE, printf h) oos URE S 
HIB 4438 Flappsiflags gs B ^ /E — here. 

char * Text. get(char *str, int size, T s) 

把 s.str[0,.str.len -1] f$ JL Slstr(O..size-1]. PERM ^E Y. str, dns 


stry7s , ，Text_get 则 分 配 空间 。str 不 为 空 目 size<s.len+1 时 产 牛 一 个 cTe.。 


int Text_many(T s, int i, int j, T set) 

参见 Str_many 。 

T Text_map(T s, const T *from, const T *to) Mem, Failed 

返回 一 个 根据 from 和 to 映射 * 中 的 字符 所 得 到 字符 串 。 参 见 Str_map 。 如 果 from 和 to 都 为 
F, 就 使 用 它们 以 前 的 值 。 如 果 s 为 袍 ， 代 om 和 to 建立 一 个 默认 的 映射 。from 和 to 中 仅 有 -个 
为 空 或 from ->len to->len 时 产生 一 个 ec.r.e.。 

int Text_match(T s, int i, int j, T str) 

SW Str match, 

int Text. pos(T s, int i) 

参见 Str_pos 。 

T Text put(const char *str) Mem Failed 

TOU SF EE Istri 01 SE 4y:B 35 RII GE PLE RA. str ATE HEP Pore. ， 

int Text rchr(T s, int i, int j, int c) 

参见 Str_rchr。 

void Text_restore(Text_save_T *save) 

SUB SERE Sins MR F save BFS ARH, save 为 空 时 产生 一 个 c.r.e.。 调 用 Text_restore 之 后 
使 用 其 他 表示 高 于 save 单 元 的 Text_save_T 值 会 产生 一 -个 u.r.e.。 

T Text reverse(T s) Mem, Failed 

以 s 中 字符 的 相反 顺序 生成 其 副本 并 返回 这 个 副本 。 

int Text_rfind(T s, int i, int j, T str) 

参见 Str_rfind 。 

int Text_rmany(T s, int i, int j, T str) 

参见 Str_rmany。 

int Text_rmatch(T s, int i, int j, T str) 
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参见 Str_rmatch , 

int Text_rupto(T s, int i, int j, T set) 

参见 Str_rupto 。 

Text_save_T Text_save(void) Mem_Failed 

ABIT SEAS Pa sz VAT Si EAT SE — RH ET 
T Text_sub(T s, int i, int j) 

返回 si : jl, 

int Text upto(T s, int i, int j, T set) 

参见 Str_upto。 


Thread TT 是 隐 式 Thread_T 


调用 Thread_init 之 前 调用 任何 Thread 函数 都 会 产生 一 个 c.r.e.， 

void Thread_alert(T t) 

设置 的 未 决 敬告 标志 并 使 (可 运行 。 下 次 + 运行 时 或 调用 模块 化 Thread 、Sem 或 Chan 原 语 
时 清空 其 标志 并 引发 Thread_Alerted 。t 为 空 或 给 一 个 不 存在 的 线程 命名 会 产生 -个 c.re.。 

void Thread, exit(int code) 

终止 调用 线程 并 将 code 传 递 给 任 一 等 待 调用 线程 结束 的 线程 。 当 最 后 一 个 线程 调用 
Thread_exit 时 ， 程 序 就 终止 于 exit(code)。 

int Thread_init(int preempt, ...) 

将 Thread 初 始 化 为 无 优先 权 (preempt 20 ) 或 有 优先 权 (preempt = 1) 调度 并 返回 
preempt; 如 果 preempt=1 且 不 支持 优先 权 调度 则 返回 0. Thread_init 可 以 接受 实现 所 定义 的 其 
他 参数 : 参数 列表 必须 以 空 字符 结束 。 多 次 调用 Thread_init 会 产生 一 个 c.re.。 

int Thread_join(T t) Thread_Alerted 

挂 起 调用 线程 直到 线程 (终止 。 当 t 终 止 时 ，Thread_join 返 回 t 的 返回 码 。 如 果 t 为 空 ， 调 
用 线程 就 等 待 其 他 所 有 线程 结束 ， 然 后 返回 0。: 要 给 调用 线程 命名 或 多 个 线程 传递 空 { 则 会 产 
生 一 个 c.r.e.。 

T Thread_new(int apply(void *), void *args, int nbytes, ...), 

Thread_Failed 

创建 、 初 始 化 并 启动 一 个 新 线程 ， 然 后 返回 其 句柄 。 如 果 nbytes=0 ， 新 线程 就 执行 
Thread_exit(apply(args)) ; 否则 执行 Thread_exit(apply(p))， 这 里 p 指 向 一 个 从 args 开 始 的 
abytes 内 存 块 副本 。 新 线程 开始 于 它 自己 的 空 异常 堆栈 。Thread_new 可 以 接受 实现 所 定义 的 
其 他 参数 ; 参数 列表 必须 以 空 字符 结束 。 apply 为 空 或 者 args 为 空 日 nbytes<0 时 产生 一 个 


CIE. o 





void Thread_pause(void) 

放弃 处 理 器 供 另 一 线程 使 用 ， 可 能 是 调用 方 。 
T Thread_self(void) 

返回 调用 线程 的 句柄 。 
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XP TRXP T 


typedef unsigned char *T; 
一 个 扩展 精度 的 无 符号 整数 按 ?为 底 表示 成 na 位 数组 ， 最 无 效 数字 在 第 一 位 。 大 多 数 XP 
函数 把 a 当 作 与 源 和 目的 Ts 一 起 的 一 个 参数 ; n<1 或 不 是 Ts 的 相应 长 度 时 产生 一 个 ure.。 向 
任 一 XP 函 数 传递 一 个 空 T 或 太 小 的 T 部 会 产生 一 个 ur.e.。 
int XP_add(int n, T z, T x, Ty, int carry) 
将 z[0..n~ 菇 设 为 x+y+carry 并 返回 z[n-1] 中 的 进位 。carry 必 须 为 0 或 1。 
int XP_cmp(int n, T x, T y) 
如 果 x<y 、x=y 或 x>y 则 分 别 返回 小 于 0 、 等 于 0 或 大 于 0 的 整数 。 
int XP. diff(int n, T z, T x, int y) 
将 z[0..n ~1] 设 为 x-y， 这 里 y 星 一 位 数字 ， 并 返回 z[n- 1] PAE. yo PEE Aure.. 
int XP_div(int n, Tq, T x, int m, Ty, Tr, T tmp) 
Ffq[0..n—1] i 29x[0..n-1)/y[0..m-11, r[0..m-1]2E 2 x[0..n-11 mod y[0..m-1], fiy «0, 
BEM. MM Ry=0, XP divi HOH iq Mr A. tmp 4^ UE 44i ni m2 RS, qz fix a 
了 中 其 一 时 .9 及 r 都 同 为 T 时 或 者 tmp 太 小 时 则 是 个 ure,。 
unsigned long XP_fromint(int n, T z, unsigned long u) 
¥§2[0..0-1] Bu mod 28 并 返回 u/2sn , 
int XP. fromstr(int n, T z, const char *str, int base, char * *end) 
将 str 解 释 为 以 base 为 底 的 无 符 续 整数 ， 并 在 转换 中 把 z[0..n-1] 用 作 初 始 值 ， 然 后 返回 转 
换 的 第 一 个 非 零 结果 。 如 果 end 不 为 空 ，*end 指 向 str 中 终 i F1 HR Te SEUERE IUE RETF 。 
参见 AP_fromstr o 
int XP_length(int n, T x) 
返回 x 的 长 度 ， 也 即 ， 下 标 加 上 x[0..n-1]} 中 的 一 个 最 有 效 非 零 位 。 
void XP Ishift(int n, T z, int m, T x, int s, int fill) 
YézI[0..n—1] BEXx[O.. m -1] A rs ir JE 0 25 L. JE ALL A h 042, AOR 
s<0 时 产生 一 个 nuT.e.。 
int XP_mul(T z, int n, T x, int m, T y) 
TEx[0..n—1] - y[0..m 1] Slz[0..n-«m 113 g F]z[n+m-1100 2818, MW iz-0, XP. mul Jj 
计算 x - y。z 是 与 x 或 ?相同 的 T 时 产生 一 个 ure.。 
int XP_neg(int n, T z, T x, int carry) 
将 z[0..n- 日 设 为 ~x+carry ， 这 里 carry 为 0 或 1 HK [plzlIn-1]6025 98, 
int XP_product(int n, T z, T x, int y) 
将 z[0.n-U 设 为 xK，y， 这 里 y 为 一 位 的 数字 ， 并 返回 zim-]1] 的 结果 。 y Sf ME ure. 
int XP quotient(int n, T z, T x, int y) 
将 z[0..n-1] 设 为 xy， 这 时 y 为 一 位 的 数字 ， 并 返回 x mod y, ys0sty = 258) 2E- 个 ure.。 
void XP_rshift(int n, T z, int m, T x, int s, int fill) 
右 移 ; 参见 XP_lshift。 如 果 n>m ， 多 余 的 位 就 当 作 它们 等 于 fill。 
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int XP_sub(int n, T z, T x, T y, int borrow) 

将 z[0..n -1] 设 为 x-y-borrow， 并 返回 zfn-1] 中 的 借 位 。borrow 必 须 为 0 或 1。 

int XP. sum(int n, T z, T x, int y) 

将 z[0.n- 设 为 g +y， 这 里 y 为 一 位 的 数字 ， 并 返回 z[n-1] 的 结果 。y 225847 4k ure., 
unsigned long XP_toint(int n, T x) 

返回 x mod (ULONG. MAX«1), 


char * XP. tostr(char *str, int size, int base, int n, T x) 


Fix 以 base 为 底数 的 字符 表示 形式 填充 str[0..size -1] ,并 将 x 设 为 0, 然后 返回 str 。str 为 空 、 


size 太 小 或 者 base<2 或 base>36 时 产生 一 个 ec.re.。 
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